モデル一覧に戻る
OpenAIプロプライエタリ

GPT-5.1 Instant

GPT-5.1 InstantはOpenAIが開発した推論モデルです。400Kの長いコンテキストウィンドウを備え、高度な推論能力を提供します。

パラメータ

非公開

コンテキスト長

400K

ライセンス

プロプライエタリ

リリース日

2025-11-12

API料金

入力料金(1Mトークンあたり)

$1.25

出力料金(1Mトークンあたり)

$

課金モード: standard

強み

  • 高度な推論能力の提供
  • 400Kの広範な文脈理解
  • OpenAIによる最新設計

弱み

  • 非オープンソースのライセンス
  • 詳細な仕様の限定的な公開
  • クローズドな利用環境

活用例

  • 複雑な論理的思考を要するタスク
  • 長大なドキュメントの解析
  • 高度な推論が必要な問題解決

深度分析

リリース日

November 12, 2025

コンテキストウィンドウ

128K tokens

最大出力

16K tokens

入力価格

$1.25 / 1M tokens

出力価格

$10.00 / 1M tokens

キャッシュ読み込み

$0.13 / 1M tokens

レイテンシ(P50 TTFT)

0.6s (OpenAI), 1.2s (Azure)

スループット (P50)

102 TPS

強み

  • GPT-5.1ファミリーで最速のモデルで、P50の初トークンまでの時間が0.6秒
  • 1秒あたり102トークンの高スループットでリアルタイムアプリケーションに対応
  • ツール利用、ビジョン、ファイル入力、推論、ウェブ検索をサポート
  • OpenAIおよびAzureの両方で利用可能で、データ保持ゼロに対応
  • 多数の同時リクエストを伴う高スループットのバックエンドAPIに最適

弱み

  • 最大出力トークンが16Kに制限されており、長文生成には不向き
  • GPT-5.1 Thinking(410K)と比較してコンテキストウィンドウが小さい(128K)
  • 推論能力の低下により、Thinking版よりハルシネーション率が高い
  • より低コストで高品質を提供するGPT-5.2 Chat (Instant)に代替された
  • 性能が低下しているにもかかわらず、GPT-5.1 Thinkingと同じ価格($1.25/$10)

競合比較

ModelArenaSWEGPQAPrice
Claude Haiku 4~1350~45%~72%$0.25/$1.25 per 1M tokens
Gemini 3 Flash~1370~50%~78%$0.15/$0.60 per 1M tokens
GPT-5.2 Instant~1400~60%~85%$0.875/$7 per 1M tokens
GPT-5.1 Thinking~1400~74%~88%$1.25/$10 per 1M tokens

GPT-5.1 InstantGPT-5.1シリーズで最速のモデルであり、汎用タスクにおける低レイテンシー応答に最適化されています。2025年11月12日にリリースされ、0.6秒の初回トークン応答時間と102 TPSのスループットを、100万トークンあたり$1.25/$10で提供します。GPT-5.1の生成品質をリアルタイムワークロードにもたらしますが、より安価で高品質なGPT-5.2 Instantに取って代わられました。

分析生成日: 2026-05-30