Gemini 3 Deep Think February 2026 Upgrade
Gemini 3 Deep Think February 2026 Upgradeは、Google DeepMindが開発した推論モデルです。1Mの広大なコンテキストウィンドウを備えており、高度な推論能力を提供します。
パラメータ
非公開
コンテキスト長
1M
ライセンス
プロプライエタリ
リリース日
2026-02-13
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・強力な推論能力を搭載
- ・100万トークンの長い文脈
- ・Google DeepMindによる開発
弱み
- ・非オープンソースのライセンス
- ・詳細なベンチマークが未公開
- ・クローズドな利用体系
活用例
- ・複雑な論理的思考を要するタスク
- ・超長文ドキュメントの解析
- ・高度な問題解決への適用
深度分析
ARC-AGI-2
84.6%
ARC Prize verified, 15.8pp above Claude Opus 4.6 (68.8%), 31.7pp above GPT-5.2 (52.9%)
GPQAダイヤモンド
93.8%
PhD-level science, slightly above GPT-5.2 (93.2%) and Claude Opus 4.6 (91.3%)
CodeforcesのEloレート
3455
Legendary Grandmaster status, far above Claude Opus 4.6 (2352)
人類最後の試験
48.4% (no tools)
New standard; 53.4% with search + code execution
国際数学オリンピック2025
81.5%
Gold-medal level performance on International Math Olympiad
コンテキストウィンドウ
1M tokens
1,000,000 input / 64,000 output
入力価格
$2.00/M tokens
$4.00/M for prompts >200K tokens
出力価格
$12.00/M tokens
$18.00/M for prompts >200K tokens
リリース日
February 12, 2026
Major upgrade to Gemini 3 Deep Think reasoning mode
強み
- ・抽象推論(ARC-AGI-2 84.6%)および競技プログラミング(Codeforces 3455)における断トツの首位
- ・IMO、IPhO(87.7%)、IChO(82.8%)2025における金メダル級のパフォーマンス
- ・化学、物理学、物性理論における最強の科学的推論能力
- ・マルチモーダル入力対応(テキスト、画像、音声、動画)
- ・100万トークンのコンテキストウィンドウ
弱み
- ・エージェント型エンタープライズタスクでClaude Opus 4.6に後れを取る(GDPval-AA ~1200対1606)
- ・実践的なコーディングで劣勢(SWE-bench 76.2%対Claude 80.8%)
- ・深い推論チェーンによるレイテンシーの増大
- ・Gemini 2.5 Deep Thinkよりコストが高い($2/$12対$1.25/$10)
- ・早期APIアクセスのみ(2026年2月時点で広く利用可能ではない)
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Gemini 3 Deep Think | ~1500 (est) | 76.2% | 93.8% | $2/$12 per 1M |
| Claude Opus 4.6 Thinking Max | ~1490 | 80.8% | 91.3% | $15/$75 per 1M |
| GPT-5.2 Thinking xhigh | ~1480 | 80.0% | 93.2% | $5/$20 per 1M |
| Gemini 3 Pro (standard) | ~1470 | 76.2% | 91.9% | $2/$12 per 1M |
Gemini 3 Deep Thinkの2026年2月アップグレードは、Googleの最強の推論モードであり、ARC-AGI-2(84.6%)、Codeforces(3455 Elo)、および複数の国際科学オリンピックにおいて最先端の結果を達成しました。抽象推論、数学的証明、科学的分析に優れていますが、実用的なエージェント機能およびエンタープライズタスクにおいてはClaude Opus 4.6に劣ります。
出典
分析生成日: 2026-05-30