モデル一覧に戻る
OpenAIプロプライエタリ

GPT-5.1 Codex Max

OpenAIのコーディング特化モデルの最上位版。SWE-bench Verifiedで68.2を記録し、実践的なソフトウェア開発タスクにおいてトップクラスの性能を発揮する。

パラメータ

非公開

コンテキスト長

256K

ライセンス

プロプライエタリ

リリース日

2026-02-10

日本語性能

高品質日本語

多言語対応モデルのうち、日本語処理に優れた性能を持つモデル。

API料金

入力料金(1Mトークンあたり)

$2.5

出力料金(1Mトークンあたり)

$15

課金モード: standard

強み

  • コーディング性能が最高水準
  • SWE-bench Verifiedトップクラス
  • 256Kコンテキストで大規模コードベース対応
  • バッチAPIで50%割引

弱み

  • 汎用テキスト生成ではGPT-5.2に劣る
  • コーディング以外の用途には不向き
  • 料金がやや高額

活用例

  • 大規模コード生成
  • リファクタリング支援
  • マルチファイルのデバッグ
  • CI/CDパイプラインへの組み込み

深度分析

SWE-Bench

72.1%

コーディング特化

入力価格

$10/1M

高コスト

出力価格

$30/1M

高コスト

コンテキスト

200Kトークン

コーディング向け

強み

  • 24時間以上の自律コーディングセッション
  • コンテキスト圧縮技術による長時間実行
  • GPT-5.1の改良版
  • 大規模リファクタリングに最適

弱み

  • GPT-5.4で大幅な改善あり
  • コストが高め
  • API利用が限定的

競合比較

ModelArenaSWEGPQAPrice
GPT-5.1-Codex-Max134977.9%N/A$1.25/$10.00
Claude Opus 4.5N/A80.9%N/A$17/month+
Gemini 3 ProN/A76.2%N/AN/A

GPT-5.1-Codex-Maxは、OpenAIの自律型ソフトウェアエンジニアリングに特化した最前線のモデルです。2025年11月19日にリリースされ、GPT-5.1の基盤を活かしつつ、エージェント的コーディングタスク向けの特別なトレーニングを受けています。このモデルの決定的な革新は「コンテキスト圧縮」です。これはネイティブなトレーニングプロセスであり、複数のコンテキストウィンドウを跨いで一貫した動作を可能にし、数百万トークンにわたる作業を数時間、あるいは数日間にわたって継続させます。これにより、単純なコード補完を超え、真の自律型開発ワークフローが実現します。

OpenAIのCodexエコシステム(CLI、IDE拡張機能、クラウド)におけるデフォルトモデルとして位置づけられているCodex-Maxは、プロジェクト規模のリファクタリング、深いデバッグセッション、長時間実行されるエージェントループを処理する必要があるプロフェッショナル開発者およびエンジニアリングチームを対象としています。高いベンチマークスコアを達成している一方で、その真の価値は運用の持続性とトークン効率にあります。同等のパフォーマンスを維持しながら、前身モデルより30%少ない「思考トークン」を使用します。このモデルは明示的に汎用チャットボットではなく、Codexのような環境向けに設計されており、開発ツールとの組み合わせで真価を発揮します。

競合環境において、Codex-MaxはSWE-bench VerifiedにおいてAnthropicのClaude Opus 4.5にやや後れを取っています(77.9%対80.9%)が、他のコーディング評価では先行しています。GoogleのGemini 3 Proなどの競合製品に対する真の差別化要素は、長期ホライズンの自律性、ネイティブなWindowsサポート、OpenAIの開発者エコシステムとの統合という組み合わせです。価格設定はそのプレミアムポジショニングを反映しており、出力コストは100万トークンあたり10ドルです。これは汎用モデルより大幅に高いものの、高付加価値のソフトウェアエンジニアリング作業においては正当化されます。

分析生成日: 2026-05-23