このモデルの強みは何ですか？

強力な推論能力を搭載 100万トークンの長い文脈 Google DeepMindによる開発

このモデルの弱みは何ですか？

非オープンソースのライセンス詳細なベンチマークが未公開クローズドな利用体系

どんな用途に最適ですか？

複雑な論理的思考を要するタスク超長文ドキュメントの解析高度な問題解決への適用

モデル一覧に戻る

Google Deep Mindプロプライエタリ

Gemini 3 Deep Think February 2026 Upgrade

Name: Gemini 3 Deep Think February 2026 Upgrade
Author: Google Deep Mind

Gemini 3 Deep Think February 2026 Upgradeは、Google DeepMindが開発した推論モデルです。1Mの広大なコンテキストウィンドウを備えており、高度な推論能力を提供します。

パラメータ

非公開

コンテキスト長

ライセンス

プロプライエタリ

リリース日

2026-02-13

API料金

このモデルのAPI料金情報は現在未公開です

強み

・強力な推論能力を搭載
・100万トークンの長い文脈
・Google DeepMindによる開発

弱み

・非オープンソースのライセンス
・詳細なベンチマークが未公開
・クローズドな利用体系

活用例

・複雑な論理的思考を要するタスク
・超長文ドキュメントの解析
・高度な問題解決への適用

深度分析

ARC-AGI-2

84.6%

ARC Prize verified, 15.8pp above Claude Opus 4.6 (68.8%), 31.7pp above GPT-5.2 (52.9%)

GPQAダイヤモンド

93.8%

PhD-level science, slightly above GPT-5.2 (93.2%) and Claude Opus 4.6 (91.3%)

CodeforcesのEloレート

3455

Legendary Grandmaster status, far above Claude Opus 4.6 (2352)

人類最後の試験

48.4% (no tools)

New standard; 53.4% with search + code execution

国際数学オリンピック2025

81.5%

Gold-medal level performance on International Math Olympiad

コンテキストウィンドウ

1M tokens

1,000,000 input / 64,000 output

入力価格

$2.00/M tokens

$4.00/M for prompts >200K tokens

出力価格

$12.00/M tokens

$18.00/M for prompts >200K tokens

リリース日

February 12, 2026

Major upgrade to Gemini 3 Deep Think reasoning mode

強み

・抽象推論（ARC-AGI-2 84.6%）および競技プログラミング（Codeforces 3455）における断トツの首位
・IMO、IPhO（87.7%）、IChO（82.8%）2025における金メダル級のパフォーマンス
・化学、物理学、物性理論における最強の科学的推論能力
・マルチモーダル入力対応（テキスト、画像、音声、動画）
・100万トークンのコンテキストウィンドウ

弱み

・エージェント型エンタープライズタスクでClaude Opus 4.6に後れを取る（GDPval-AA ~1200対1606）
・実践的なコーディングで劣勢（SWE-bench 76.2%対Claude 80.8%）
・深い推論チェーンによるレイテンシーの増大
・Gemini 2.5 Deep Thinkよりコストが高い（$2/$12対$1.25/$10）
・早期APIアクセスのみ（2026年2月時点で広く利用可能ではない）

競合比較

Model	Arena	SWE	GPQA	Price
Gemini 3 Deep Think	~1500 (est)	76.2%	93.8%	$2/$12 per 1M
Claude Opus 4.6 Thinking Max	~1490	80.8%	91.3%	$15/$75 per 1M
GPT-5.2 Thinking xhigh	~1480	80.0%	93.2%	$5/$20 per 1M
Gemini 3 Pro (standard)	~1470	76.2%	91.9%	$2/$12 per 1M

概要

Gemini 3 Deep Thinkの2026年2月アップグレードは、Googleの最強の推論モードであり、ARC-AGI-2（84.6%）、Codeforces（3455 Elo）、および複数の国際科学オリンピックにおいて最先端の結果を達成しました。抽象推論、数学的証明、科学的分析に優れていますが、実用的なエージェント機能およびエンタープライズタスクにおいてはClaude Opus 4.6に劣ります。

ベンチマーク＆性能

純粋な推論ベンチマークで圧倒：ARC-AGI-2 84.6%、Codeforces 3455、IMO金メダルレベル。GPQA Diamond 93.8%はGPT-5.2と同等レベル。ただし、SWE-bench（76.2%）やエンタープライズ向けエージェンティックベンチマーク（GDPval-AA ~1200）のような実用的なタスクでは、Claude Opus 4.6に劣る。

詳細比較

科学的推論と競技プログラミングにおいてクラス最高。困難でドメイン特異的な問題に強い専門特化型モデル。汎用コーディングやエージェント的な作業には、同等またはより低いコストでClaude Opus 4.6やGemini 3.1 Proがより良い選択肢。

コミュニティ評価

研究者および数学者から高く評価されている。査読済みの数学論文における論理的欠陥の発見に成功した。デューク大学で半導体製造の最適化に使用されている。一部の開発者は、本番環境でのレイテンシのトレードオフが大きいと指摘している。

ユースケース

科学、研究、工学の課題に特化して設計されています。数学的証明の検証、競技プログラミング、材料科学研究、複雑な物理・化学問題、深い多段階推論を必要とするタスクに最適です。一般的なチャットや高スループットのコーディングには最適ではありません。