Claude Sonnet 4.8のリークから判明した次期主力モデルの全貌と性能予測
2026年3月31日、Claude Codeのnpmパッケージ(v2.1.88)の中に「sonnet-4-8」という文字列が発見された。
Anthropicは公式発表していない。しかしリークされた情報から、Sonnet 4.8の輪郭はかなり鮮明になっている。
バージョン番号の謎:なぜ4.7を飛ばして4.8なのか
AnthropicのSonnet系列は、これまで一定のペースでバージョンアップしてきた:
| モデル | リリース | API文字列 |
|---|---|---|
| Claude 3.5 Sonnet | 2024年6月 | claude-3-5-sonnet-20240620 |
| Claude 3.7 Sonnet | 2025年2月 | claude-3-7-sonnet-20250219 |
| Claude 4 Sonnet | 2025年5月 | claude-sonnet-4-0 |
| Claude Sonnet 4.5 | 2025年9月 | claude-sonnet-4-5 |
| Claude Sonnet 4.6 | 2026年2月 | claude-sonnet-4-6 |
| Claude Sonnet 4.8 | 2026年5月(予想) | claude-sonnet-4-8 |
4.7を飛ばして4.8になることは、Opus 4.7からの単純移植ではないことを示唆している。異なる時間軸、異なる学習ランで開発された可能性がある。
予想されるスペック
リーク情報とOpus 4.7の改善率からの予測:
| 項目 | Sonnet 4.6(現在) | Sonnet 4.8(予想) |
|---|---|---|
| SWE-bench Verified | 79.6% | 82-84% |
| GPQA Diamond | 74.1% | 76-78% |
| 画像解像度上限 | ~1.25MP | 3.75MP(3倍) |
| コンテキストウィンドウ | 1M(ベータ) | 1M(GAの可能性) |
| 価格(入力/出力) | $3/$15 | $3/$15(変更なしの可能性) |
| 知識カットオフ | 2025年8月 | 2025年末〜2026年初頭 |
SWE-bench Verified:82-84%の根拠
Sonnet 4.6はSWE-bench Verifiedで79.6%を記録。Opus 4.6(80.8%)とほぼ同等だった。Opus 4.7は87.6%に到達し、Opus 4.6比で約7ポイントの改善を見せた。
Sonnet 4.8が同程度の改善幅(6-8ポイント)をSonnet 4.6から得れば、**82-84%**は妥当な予測になる。
参考:2026年5月25日時点のSWE-bench Verifiedランキング上位:
| 順位 | モデル | スコア |
|---|---|---|
| 1 | Claude Mythos Preview | 93.9% |
| 2 | Claude Opus 4.7 | 87.6% |
| 3 | GPT-5.3 Codex | 85.0% |
| 4 | Claude Opus 4.5 | 80.9% |
| 5 | Claude Opus 4.6 | 80.8% |
| 5 | DeepSeek V4 Pro (Max) | 80.6% |
| 7 | Gemini 3.1 Pro | 80.6% |
| 8 | Kimi K2.6 | 80.2% |
| 8 | MiniMax M2.5 | 80.2% |
| 10 | Claude Sonnet 4.6 | 79.6% |
Sonnet 4.8が82-84%を達成すれば、Opus 4.5やOpus 4.6を上回り、Opus 4.7に近づくことになる。Sonnetティア($3/$15)でOpus級のコーディング性能を持つモデルが登場するわけだ。
Vision:3.75MP画像対応
Opus 4.7は「98.5%の視覚精度」と「3.75MP」の画像解像度を達成した。Sonnet 4.8はこの能力をミドルティア価格に持ち込むと予想される。
Sonnet 4.6の約1.25MPから3.75MPへ——3倍の解像度向上は、文書解析、UIモックアップ理解、チャート読み取りなどの実用性を大幅に向上させる。
新しい「xhigh」エフォートレベル
Opus 4.7で導入された「xhigh」エフォートレベル(highとmaxの間)がSonnet 4.8にも移植されるとみられる。
現在のエフォートレベル:low / medium / high / max
これにxhighが追加されることで、コストと性能のトレードオフをより細かく制御できるようになる。
トークナイザーの更新
Opus 4.7の新しいトークナイザーは、コンテンツタイプに応じて1.0〜1.35倍のトークンを生成する:
| コンテンツタイプ | トークン増加率 |
|---|---|
| 英語散文 | ~1.0倍(変化なし) |
| コード | ~1.1-1.2倍 |
| 構造化データ(JSON、XML) | 最大1.35倍 |
Sonnet 4.8がこのトークナイザーを採用した場合、実質的なコストが10-35%上昇する可能性がある。API価格は$3/$15のままでも、同じコンテンツがより多くのトークンに分割されるためだ。
Sonnet 4.6からの主な改善点
1. Vision能力の大幅強化
Opus 4.7から継承されるとみられる視覚能力:
- 画像解像度:1.25MP → 3.75MP
- 視覚精度:98.5%(Opus 4.7実測)
- 文書スクリーンショット、UIモックアップ、チャートの高精度理解
2. コーディング性能の向上
Opus 4.7の改善実績:
- CursorBench:58% → 70%(+12ポイント)
- 93タスクコーディングベンチマーク:+13%
- 本番環境タスク解決数:3倍
Sonnet 4.8はこれらの改善を$3/$15の価格帯にもたらす。
3. プロンプト解釈の変化
Opus 4.7は「4.6よりリテラルにプロンプトを解釈する」。Sonnet 4.8も同様の行動変化が予想される。より正確な指示遂行だが、曖昧な指示に対する柔軟性が低下する可能性もある。
価格:Sonnetティアの安定性
Sonnet系列の価格は、3.5から4.6まで一貫して$3/$15を維持してきた:
| モデル | 入力/1M | 出力/1M |
|---|---|---|
| Claude 3.5 Sonnet | $3 | $15 |
| Claude 4 Sonnet | $3 | $15 |
| Claude Sonnet 4.5 | $3 | $15 |
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Sonnet 4.8(予想) | $3 | $15 |
一方、Opusティアは4.6で$5/$25に変更された(以前の$15/$75から大幅値下げ)。Sonnet 4.8が$3/$15を維持すれば、Opus 4.7の60%の価格で82-84%のSWE-bench性能を持つモデルになる。
関連するリーク情報
KAIROS
Claude Codeのリークコードに150回以上言及されているKAIROS——永続デーモンエージェント。自律監視、メモリ統合(「autoDream」)、先制アクション、プッシュ通知を含む。
Mythos
2026年4月7日リリース。SWE-bench Verifiedで93.9%。サイバーセキュリティ用途に限定(Project Glasswing)。
numbat
リークコード内で言及されているが、詳細不明の未リリースモデル。
開発者の期待
Sonnet 4.8への開発者の期待を集約すると:
- より長い信頼性の高い出力生成
- 過剰エンジニアリングの削減(不要な複雑さの追加)
- Time-to-First-Token(TTFT)の改善
- 大規模コードベースでのマルチファイル認識
- 安定したJSON/構造化出力と制約付きデコーディング
リリース時期
リーク情報に基づく予測:
| シナリオ | 時期 | 確率 |
|---|---|---|
| ベストケース | 2026年4月下旬 | 低 |
| 最も可能性の高いケース | 2026年5月5-16日 | 中 |
| ワーストケース | 2026年5月下旬 | 中 |
Opus 4.7が4月16日にリリースされたことを考えると、Sonnet 4.8は通常3-4週間後に続く。2026年5月中旬が最も可能性の高いリリース時期だ。
競合比較
Sonnet 4.8の位置づけ:
| モデル | 入力/1M | 出力/1M | SWE-bench | 特徴 |
|---|---|---|---|---|
| Claude Sonnet 4.8(予想) | $3 | $15 | 82-84% | Vision 3.75MP、1Mコンテキスト |
| Claude Sonnet 4.6 | $3 | $15 | 79.6% | 現行主力 |
| GPT-5.2 | $1.25 | $10.00 | 80.0% | OpenAI主力 |
| DeepSeek V4 Pro (Max) | $1.74 | $3.48 | 80.6% | 最安フロンティア |
| Gemini 3.1 Pro | $2.50 | $15.00 | 80.6% | Google主力 |
| MiniMax M2.5 | $0.15 | $1.15 | 80.2% | コーディング特化・最安 |
Sonnet 4.8が82-84%を達成すれば、Sonnetティアで最強のコーディングモデルになる。$3/$15でOpus 4.5(80.9%)やOpus 4.6(80.8%)を上回る計算だ。
まとめ
Claude Sonnet 4.8は、AnthropicのSonnet系列にとって最大の飛躍になる可能性がある。
Opus 4.7のVision能力、コーディング性能、エフォートレベルを$3/$15の価格帯に持ち込む。SWE-bench Verifiedで82-84%を達成すれば、Opus級の性能をSonnet価格で提供するモデルが誕生する。
リーク情報に基づく予測だが、AnthropicのSonnet系列の歴史を振り返れば、この程度の改善は十分に現実的だ。正式発表を待つしかないが、開発者にとって最も注目すべきモデルの一つだ。
読み込み中...