モデル一覧に戻る
Google Deep Mindプロプライエタリ

Gemini 3 Deep Think February 2026 Upgrade

Gemini 3 Deep Think February 2026 Upgradeは、Google DeepMindが開発した推論モデルです。1Mの広大なコンテキストウィンドウを備えており、高度な推論能力を提供します。

パラメータ

非公開

コンテキスト長

1M

ライセンス

プロプライエタリ

リリース日

2026-02-13

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 強力な推論能力を搭載
  • 100万トークンの長い文脈
  • Google DeepMindによる開発

弱み

  • 非オープンソースのライセンス
  • 詳細なベンチマークが未公開
  • クローズドな利用体系

活用例

  • 複雑な論理的思考を要するタスク
  • 超長文ドキュメントの解析
  • 高度な問題解決への適用

深度分析

ARC-AGI-2

84.6%

ARC Prize verified, 15.8pp above Claude Opus 4.6 (68.8%), 31.7pp above GPT-5.2 (52.9%)

GPQAダイヤモンド

93.8%

PhD-level science, slightly above GPT-5.2 (93.2%) and Claude Opus 4.6 (91.3%)

CodeforcesのEloレート

3455

Legendary Grandmaster status, far above Claude Opus 4.6 (2352)

人類最後の試験

48.4% (no tools)

New standard; 53.4% with search + code execution

国際数学オリンピック2025

81.5%

Gold-medal level performance on International Math Olympiad

コンテキストウィンドウ

1M tokens

1,000,000 input / 64,000 output

入力価格

$2.00/M tokens

$4.00/M for prompts >200K tokens

出力価格

$12.00/M tokens

$18.00/M for prompts >200K tokens

リリース日

February 12, 2026

Major upgrade to Gemini 3 Deep Think reasoning mode

強み

  • 抽象推論(ARC-AGI-2 84.6%)および競技プログラミング(Codeforces 3455)における断トツの首位
  • IMO、IPhO(87.7%)、IChO(82.8%)2025における金メダル級のパフォーマンス
  • 化学、物理学、物性理論における最強の科学的推論能力
  • マルチモーダル入力対応(テキスト、画像、音声、動画)
  • 100万トークンのコンテキストウィンドウ

弱み

  • エージェント型エンタープライズタスクでClaude Opus 4.6に後れを取る(GDPval-AA ~1200対1606)
  • 実践的なコーディングで劣勢(SWE-bench 76.2%対Claude 80.8%)
  • 深い推論チェーンによるレイテンシーの増大
  • Gemini 2.5 Deep Thinkよりコストが高い($2/$12対$1.25/$10)
  • 早期APIアクセスのみ(2026年2月時点で広く利用可能ではない)

競合比較

ModelArenaSWEGPQAPrice
Gemini 3 Deep Think~1500 (est)76.2%93.8%$2/$12 per 1M
Claude Opus 4.6 Thinking Max~149080.8%91.3%$15/$75 per 1M
GPT-5.2 Thinking xhigh~148080.0%93.2%$5/$20 per 1M
Gemini 3 Pro (standard)~147076.2%91.9%$2/$12 per 1M

Gemini 3 Deep Thinkの2026年2月アップグレードは、Googleの最強の推論モードであり、ARC-AGI-2(84.6%)、Codeforces(3455 Elo)、および複数の国際科学オリンピックにおいて最先端の結果を達成しました。抽象推論、数学的証明、科学的分析に優れていますが、実用的なエージェント機能およびエンタープライズタスクにおいてはClaude Opus 4.6に劣ります。

分析生成日: 2026-05-30