GPT-5.2
OpenAIの主力汎用モデル。前世代GPT-5.1から推論・コーディング性能を大幅に向上させた。256Kトークンのコンテキストウィンドウをサポートし、幅広いタスクで安定した高性能を発揮する。
パラメータ
非公開
コンテキスト長
256K
ライセンス
プロプライエタリ
リリース日
2026-04-20
日本語性能
多言語対応モデルのうち、日本語処理に優れた性能を持つモデル。
API料金
入力料金(1Mトークンあたり)
$1.25
出力料金(1Mトークンあたり)
$10
課金モード: standard
強み
- ・汎用性が高い
- ・256Kの長文コンテキスト
- ・Instant版で高速・低コスト
- ・エコシステムが充実
弱み
- ・Pro版は高額
- ・オープンソースではない
- ・日本語処理は専用モデルに劣る場合がある
活用例
- ・汎用的なテキスト生成
- ・コーディング支援
- ・長文の要約・分析
- ・チャットボット
深度分析
Arena Elo (テキスト)
1436
BenchLM 仮定リーダーボードで117モデル中 #21
GPQA Diamond
92.4%
知識カテゴリで #6; Gemini 3 Pro と比較: 91.9%
SWE-Bench Verified
80.0%
Claude Opus 4.5 と比較: 80.9% (実質的に同率)
GDPval (知識労働)
70.9%
44職業のベンチマークで人間の専門家を初めて上回ったモデル
コンテキストウィンドウ
400Kトークン
MRCRv2 で 256K までほぼ100%の一貫性を維持
API 料金
$1.75/$14 (100万トークンあたり)
GPT-5.1 に比べ40%増; キャッシュ入力は90%割引
強み
- ・専門知識業務で最高の性能 — GDPval で44職業にわたり人間の専門家を初めて上回る (70.9%)
- ・優れた長文脈の整合性。MRCRv2 で256Kトークンまでほぼ完璧な精度を維持
- ・大学院レベルの科学と推論に強み: GPQA Diamond 92.4%, AIME 2025 で100%, ARC-AGI-2 で52.9%
弱み
- ・同世代モデルと比較しエージェント性能が弱い — BenchLM で #29 にランクインし、エージェントベンチマークでは100点満点中61.0点
- ・数ヶ月以内に GPT-5.4 と GPT-5.5 に取って代わられた; GPT-5.2 Thinking は2026年6月3日に退役予定
- ・GPT-5.1 に比べ40%の値上げ ($1.75/$14 vs $1.25/$10)。一部のカテゴリでは限界的な改善が減少
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Claude Opus 4.5 | ~1430* | 80.9% | 87.0% | $5/$25 |
| Gemini 3 Pro | ~1440* | 91.9% | $2/$12 | |
| GPT-5.4 (後継) | N/A | 92.8% | $2.50/$15 |
2025年12月11日にリリースされた GPT-5.2 は、Google の Gemini 3 Pro と Anthropic の Claude Opus 4.5 からの競争圧力に対する OpenAI の積極的な応答であり、社内では「Code Red」作戦と呼ばれていました。このモデルは、クエリの複雑さに基づいてコンピューティングを動的に割り当てる適応型推論機能を備えた、3層アーキテクチャ(Instant, Thinking, Pro)を導入しました。いくつかのマイルストーン的なベンチマークを達成しました: ARC-AGI-1(Pro ティア)で90%を初めて超え、AIME 2025 で満点の100%、そして GDPval で70.9% — OpenAI 独自の知識労働ベンチマークで、44職業にわたり人間の業界プロフェッショルを初めて上回る AI となりました。
このモデルの最も強力な位置づけは、専門知識業務、科学推論(GPQA Diamond: 92.4%)、長文脈分析(256Kトークンでほぼ完璧な検索)、コーディング(SWE-Bench Verified: 80.0%)にありました。GPT-5.1 に比べ、エラーを含む回答を30-38%削減し、本番ワークフロー用として大幅に信頼性を高めました。しかし、エージェントタスクでは目立った弱点を示し(BenchLM で #29)、包括的なビジョンベンチマークではマルチモーダル機能が Gemini 3 Pro の後塵を拝しました。このモデルはまた、前任者に比べ40%の価格プレミアムがつきました。
GPT-5 ファミリーの急速な進化の中で、GPT-5.2 は「推論マイルストーン」として、GPT-5.3(2026年3月)、GPT-5.4(2026年3月、1M コンテキストとコンピューター使用を追加)、および GPT-5.5(2026年4月)によって段階的に置き換えられる前に、新たなベンチマークを設定しました。2026年5月時点では、GPT-5.2 Thinking は2026年6月3日に退役予定となっており、推奨されるアップグレードパスは GPT-5.4 以上です。最新のフロンティアモデルよりも低コストで強力な推論が必要な、コスト意識の高いユーザー向けに引き続き利用可能です。
出典
- GPT-5.2 Benchmarks 2026: Scores, Rankings & Performance | BenchLM.ai
- OpenAI GPT-5.2 API | Readme and Docs
- GPT-5.2 by OpenAI: Complete Performance Review & Benchmarks (2026)
- GPT-5.2 - Intelligence, Performance & Price Analysis | Artificial Analysis
- GPT-5.2 Is OpenAI's 'Code Red' Counterpunch, and It Mostly Lands | Turing College
- GPT 5.2 Complete Review: Features, Benchmarks, Pricing | Macaron
- The Ultimate ChatGPT Model Comparison: GPT-5.0 to 5.5 | Fello AI
- GPT-5.2 Benchmark Analysis: Reclaiming Leadership vs Gemini 3 Pro & GPT-5.1
- GPT 5.2 Ultimate Guide: Features, Pricing, and Benchmarks | Enter Pro
- GPT-5.2 by openai Benchmarks – LLM Benchmarks
分析生成日: 2026-05-23