モデル一覧に戻る
Google Deep Mindプロプライエタリ

Gemini 2.5 Deep Think

Gemini 2.5 Deep Thinkは、Google Deep Mindが開発した推論モデルです。1000Kという非常に長いコンテキストウィンドウを備えたチャット特化型の基盤モデルとなっています。

パラメータ

非公開

コンテキスト長

1000K

ライセンス

プロプライエタリ

リリース日

2025-08-01

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 極めて長いコンテキスト窓
  • 高度な推論能力の実現
  • Google Deep Mind製

弱み

  • クローズドソースのライセンス
  • モデル内部の詳細が非公開
  • 利用条件に制限がある可能性

活用例

  • 大規模ドキュメントの解析
  • 複雑な論理推論タスク
  • 高度な対話型チャット利用

深度分析

GPQAダイヤモンド

92%

PhD-level science reasoning, tops Claude 4.7 (88%) and GPT-5 (90%)

SWE-bench 検証済み

~78%

Coding benchmark, behind Claude 4.7 (~85%) and GPT-5 (~80%)

アリーナElo

~1465

Based on Gemini 2.5 Pro base, Deep Think adds extended reasoning

コンテキストウィンドウ

1M tokens

1,000,000 input tokens

入力価格

$1.25/M tokens

Cheapest frontier reasoning model at 1M-token scale

出力価格

$10.00/M tokens

Standard output pricing for reasoning tier

出力速度

~30 tok/s

Slower than GPT-5 (~110) and Claude 4.7 (~80) due to deep reasoning chains

リリース

April 2026 (GA)

全ての有料APIユーザーに開放(以前はAI Ultraのみ)

強み

  • 2026年5月時点でのフロンティアモデル中、GPQA Diamondスコア最高(92%)
  • $1.25/1Mトークン入力で最も安価なフロンティア推論モデル
  • 100万トークンのコンテキスト、50万トークンでneedle-in-haystack 98%
  • 国際数学オリンピック金メダルレベル
  • 高いneedle-in-haystack検索性能(50万トークンで98%)

弱み

  • 拡張思考により出力速度が競合他社より遅い(約30トークン/秒)
  • 初回トークンまでの時間が約1.1秒で、GPT-5(0.4秒)およびClaude 4.7(0.6秒)より遅い
  • コーディング性能が劣る(SWE-benchで78%、Claude 4.7は85%)
  • コンピュータ使用/ブラウザ機能はまだ実験的
  • Deep Thinkモードはより多くのコンピューティングリソースを必要とし、実効コストが増加

競合比較

ModelArenaSWEGPQAPrice
Claude 4.7 Sonnet~1470~85%88%$3/$15 per 1M
GPT-5~1480~80%90%$5/$20 per 1M
Gemini 2.5 Deep Think~1465~78%92%$1.25/$10 per 1M

Model: gemini-2-5-deep-think Field: summary

ジェミニ 2.5 Deep Thinkは、Gemini 2.5 Proをベースに構築されたGoogleの拡張推論モードで、2026年4月にすべての有料APIユーザーに開放されました。純粋な推論ベンチマーク(GPQA 92%、ARC-AGI)でリードしていますが、コーディングタスクではClaude 4.7およびGPT-5に後れを取っています。際立った利点は、フロンティア推論モデル中で最も低価格であること(入力トークン100万あたり1.25ドル)であり、100万のコンテキストウィンドウを備えている点です。

分析生成日: 2026-05-30