モデル一覧に戻る
Anthropicプロプライエタリ
Claude Opus 4.8
Anthropicの最新ハイブリッド推論モデル。Opus 4.7をベースに、コーディング・AIエージェント・エンタープライズワークフローの各分野で性能が向上。100万トークンのコンテキストウィンドウを搭載し、適応型思考によりタスクの複雑さに応じて推論深度を自動調整する。Claude Codeでは大規模問題に対応するダイナミックワークフロー機能をサポート。
パラメータ
非公開
コンテキスト長
1M
ライセンス
プロプライエタリ
リリース日
2026-05-28
日本語性能
✅高品質日本語
多言語対応モデルのうち、日本語処理に優れた性能を持つモデル。
API料金
入力料金(1Mトークンあたり)
$5
出力料金(1Mトークンあたり)
$25
課金モード: standard
強み
- ・100万トークンの超長コンテキストウィンドウ
- ・コーディング・エージェント性能がOpus 4.7を大幅超越
- ・適応型思考による自動推論深度調整
- ・GPT-5.5を上回るベンチマークスコア
- ・プロンプトキャッシュで最大90%コスト削減
- ・バッチ処理で50%割引
弱み
- ・API料金は高額
- ・オープンソースではない
- ・軽量タスクにはオーバースペック
活用例
- ・高度なソフトウェアエンジニアリング
- ・複雑なAIエージェントワークフロー
- ・エンタープライズ業務自動化
- ・長文コンテキストを要する分析・研究
- ・法律・金融等の専門分野での高精度タスク
深度分析
SWE-Bench Pro
69.2%
フロンティアモデル中 #1
HLE(ツール使用)
57.9%
#1 — 最難関の汎用推論
OSWorld-Verified
83.4%
#1 — コンピュータ操作
Terminal-Bench 2.1
74.6%
#2(GPT-5.5に後れ)
価格
$5/$25 per 1M
Opus 4.7と同じ
強み
- ・SWE-Bench Proで最高峰のコーディング性能(69.2% vs GPT-5.5 58.6%)
- ・HLE推論でトップ(ツール使用時 57.9% vs GPT-5.5 52.2%)
- ・コンピュータ操作で最高性能(OSWorld 83.4%)
- ・100万トークンのコンテキストウィンドウ
- ・ダイナミックワークフローによる並列サブエージェント
- ・高速モードで2.5倍速度、コスト1/3
- ・プロンプトキャッシュで最大90%節約
弱み
- ・会話スタイルが冗長で繰り返しが多い
- ・Terminal-BenchでGPT-5.5に劣る(74.6% vs 78.2%)
- ・Opus 4.7より会話の質感が悪いという報告多数
- ・マルチモーダル画像生成非対応
- ・エージェントタスクでトークン消費が大きい
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| GPT-5.5 | N/A | 58.6% | N/A | $5/$30 |
| Gemini 3.1 Pro | N/A | 54.2% | 94.3 | $5/$20 |
| Claude Opus 4.7 | 1505 | 64.3% | 94.2 | $5/$25 |
分析生成日: 2026-05-30