モデル一覧に戻る
OpenAIプロプライエタリ
OpenAI GPT-5.1-Codex-Max
OpenAI GPT-5.1-Codex-Maxは、OpenAIによって開発されたプログラミング特化の基盤モデルです。400Kという非常に長いコンテキストウィンドウを備えており、大規模なコードベースの処理に適しています。
パラメータ
非公開
コンテキスト長
400K
ライセンス
プロプライエタリ
リリース日
2025-11-19
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・高度なコーディング能力
- ・400Kの広大な文脈量
- ・OpenAIによる最適化
弱み
- ・非オープンソースの制限
- ・外部アクセスの限定性
- ・クローズドな利用条件
活用例
- ・大規模コードの解析
- ・複雑なプログラム実装
- ・高度なバグ修正作業
深度分析
リリース日
November 19, 2025
コンテキストウィンドウ
Effectively unlimited (compaction)
入力価格
$1.25 / 1M tokens
出力価格
$10.00 / 1M tokens
キャッシュ入力
$0.625 / 1M tokens
SWE-bench 検証済み
77.9% (xhigh)
ターミナルベンチ 2.0
58.1%
SWE-Lancer IC SWE(個人貢献者ソフトウェアエンジニアリング)
79.9%
モデル: openai-gpt-5-1-codex-max フィールド: label 翻訳するテキスト: 自律動作
24+ hours continuous
スループット
58.4 tok/s avg (11-110 range)
強み
- ・コンテキスト圧縮を備えた初のモデル——反復的な要約による事実上無限のコンテキスト
- ・SWE-bench Verified 77.9%、前身モデル比で思考トークン30%削減
- ・複雑なタスクにおける24時間以上の自律運用
- ・ネイティブWindowsサポート——OpenAIのコーディングモデルとして初めての提供
- ・コストと品質のトレードオフに応じた推論努力度の設定(なし/中/高/最高)
弱み
- ・高レイテンシー(平均TTFT 2,060ms)であり、変動係数169.3%という著しい変動性がある
- ・コンテキスト圧縮により、非常に長いセッションにおいて詳細が「ぼやける」可能性がある
- ・METR評価によると、80%の信頼性を維持できる時間範囲は24時間ではなく約2時間である
- ・指示を非常に文字通りに解釈するため、明らかなタイプミスを認識しない可能性がある
- ・Claude Codeと比較してコードチャーンが高く(書き直しが30%多い)
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Claude Opus 4.5 | ~1450 | 80.9% | ~92% | $15/$75 per 1M tokens |
| Gemini 3 Pro | ~1420 | 76.2% | ~90% | $3.50/$10.50 per 1M tokens |
| GPT-5.1 Codex | ~1400 | 73.7% | ~88% | $1.25/$10 per 1M tokens |
| Cursor (varies) | N/A | Varies | N/A | $20/month subscription |
出典
分析生成日: 2026-05-30