モデル一覧に戻る
Google Deep Mindプロプライエタリ

Gemini 3.1 Pro Preview

Gemini 3.1 Pro Previewは、Google DeepMindが開発したマルチモーダル基盤モデルです。100万トークンの広大なコンテキストウィンドウを備えています。

パラメータ

非公開

コンテキスト長

1M

ライセンス

プロプライエタリ

リリース日

2026-02-20

API料金

入力料金(1Mトークンあたり)

$3.6

出力料金(1Mトークンあたり)

$21.6

課金モード: standard

強み

  • 高度なマルチモーダル対応
  • 100万トークンの長大な文脈
  • Google DeepMindによる開発

弱み

  • クローズドソースのライセンス
  • プレビュー版による不安定さ
  • 詳細な性能指標の不足

活用例

  • 大規模文書の解析と要約
  • 複雑なマルチモーダル処理
  • 長文コンテキストの活用

深度分析

Arena Elo

~1493

総合3位(2026年4月)、Claude Opus 4.6 (1504) に次ぐ

SWE-Bench Verified

80.6%

対Claude Opus 4.6: 80.8% (差0.2ポイント)

GPQA Diamond

94.3%

対GPT-5.4: 92.0% (現リーダー)

ARC-AGI-2

77.1%

Gemini 3 Pro (31.1%) の2.5倍の向上

入力価格

$2/1M

200k以下のコンテキストで、最も安価なフロンティアモデル

コンテキストウィンドウ

1Mトークン

出力64K、コードベース全体をサポート

強み

  • 競合モデルの一部のコスト(Claude Opus 4.6の最大推論時と比較して64%安価)で、推論およびマルチモーダルベンチマークにおいてトップを維持。
  • 巨大な100万トークンコンテキストウィンドウにより、単一リクエストでコードベースや長文ドキュメント全体の分析が可能。
  • BrowseCompで45%向上し、ツール集約型ワークフロー向けの専用customtoolsエンドポイントにより、エージェント能力が大幅に改善。

弱み

  • 純粋なコーディング精度ではClaude Opus 4.6にわずかに及ばない(SWE-Bench 80.6% vs 80.8%)。
  • プレビュー版であるため、本番環境SLAの保証がなく、GA前にAPIの挙動が変更される可能性がある。
  • 一部の競合よりレイテンシが高く、間違っている場合により確信度が高い(Humanity's Last Examの較正誤差: Gemini 51 vs GPT-5.4 38)。

競合比較

ModelArenaSWEGPQAPrice
Claude Opus 4.6~150480.8%89.6%$5/$25 per 1M tokens
GPT-5.4~1484~80%92.0%$2.50/$15 per 1M tokens
DeepSeek R2~144162.1%82.4%$0.55/$2.19 per 1M tokens

Gemini 3.1 Pro Previewは、Google DeepMindの最新フラッグシップマルチモーダル推論モデルであり、2026年2月にGemini 3シリーズの反復的アップグレードとしてローンチされました。これはコア推論能力の大幅な進歩を示しつつ、攻撃的な価格設定を維持し、Googleをコスト効率の高いフロンティアAIのリーダーとして位置づけています。本モデルは、巨大な100万トークンコンテキストウィンドウ、テキスト、画像、音声、ビデオ、コードにまたがるネイティブマルチモーダル理解を特徴とし、特に複雑なエージェントワークフロー、高度なコーディング、長コンテキスト分析向けに最適化されています。

本モデルは、複数のベンチマークにおいて最先端または最先端に近いパフォーマンスを達成し、GPQA Diamond(94.3%)、ARC-AGI-2(77.1%)、Humanity's Last Exam(44.4%、ツールなし)でトップに立っています。Artificial Analysis Intelligence Indexでは57ポイントのスコアでGPT-5.4と並び、評価スイート全体の実行コストは半分以下です。前任者に対する主要な改善点には、抽象的推論(ARC-AGI-2)で2.5倍、検索能力(BrowseComp)で45%向上、ターミナルコーディング(Terminal-Bench 2.0)で20%向上が含まれます。

現在プレビューステータスにあるGemini 3.1 Proは、Gemini API、Vertex AI、Google AI Studio、およびGeminiアプリやNotebookLMなどの消費者製品を含むGoogleエコシステム全体で利用可能です。その価格構造により、200k以下のコンテキストの場合、入力コストが百万トークンあたり2ドルと、最もコスト効率の高いフロンティアモデルとなり、Claude Opus 4.6($5/$25)などの競合と比較して大幅に安価でありながら、ほとんどのベンチマークで同等または優れたパフォーマンスを提供します。本モデルは、フロンティア能力を手の届く価格で提供するというGoogleの戦略を体現していますが、プレビューステータスであるため、開発者は本番環境にデプロイする前にパフォーマンスを検証する必要があります。

分析生成日: 2026-05-23