ブログ一覧に戻る
Anthropic

Claude Sonnet 4.8のリークから判明した次期主力モデルの全貌と性能予測

2026年3月31日、Claude Codeのnpmパッケージ(v2.1.88)の中に「sonnet-4-8」という文字列が発見された。

Anthropicは公式発表していない。しかしリークされた情報から、Sonnet 4.8の輪郭はかなり鮮明になっている。

バージョン番号の謎:なぜ4.7を飛ばして4.8なのか

AnthropicのSonnet系列は、これまで一定のペースでバージョンアップしてきた:

モデルリリースAPI文字列
Claude 3.5 Sonnet2024年6月claude-3-5-sonnet-20240620
Claude 3.7 Sonnet2025年2月claude-3-7-sonnet-20250219
Claude 4 Sonnet2025年5月claude-sonnet-4-0
Claude Sonnet 4.52025年9月claude-sonnet-4-5
Claude Sonnet 4.62026年2月claude-sonnet-4-6
Claude Sonnet 4.82026年5月(予想)claude-sonnet-4-8

4.7を飛ばして4.8になることは、Opus 4.7からの単純移植ではないことを示唆している。異なる時間軸、異なる学習ランで開発された可能性がある。

予想されるスペック

リーク情報とOpus 4.7の改善率からの予測:

項目Sonnet 4.6(現在)Sonnet 4.8(予想)
SWE-bench Verified79.6%82-84%
GPQA Diamond74.1%76-78%
画像解像度上限~1.25MP3.75MP(3倍)
コンテキストウィンドウ1M(ベータ)1M(GAの可能性)
価格(入力/出力)$3/$15$3/$15(変更なしの可能性)
知識カットオフ2025年8月2025年末〜2026年初頭

SWE-bench Verified:82-84%の根拠

Sonnet 4.6はSWE-bench Verifiedで79.6%を記録。Opus 4.6(80.8%)とほぼ同等だった。Opus 4.7は87.6%に到達し、Opus 4.6比で約7ポイントの改善を見せた。

Sonnet 4.8が同程度の改善幅(6-8ポイント)をSonnet 4.6から得れば、**82-84%**は妥当な予測になる。

参考:2026年5月25日時点のSWE-bench Verifiedランキング上位:

順位モデルスコア
1Claude Mythos Preview93.9%
2Claude Opus 4.787.6%
3GPT-5.3 Codex85.0%
4Claude Opus 4.580.9%
5Claude Opus 4.680.8%
5DeepSeek V4 Pro (Max)80.6%
7Gemini 3.1 Pro80.6%
8Kimi K2.680.2%
8MiniMax M2.580.2%
10Claude Sonnet 4.679.6%

Sonnet 4.8が82-84%を達成すれば、Opus 4.5やOpus 4.6を上回り、Opus 4.7に近づくことになる。Sonnetティア($3/$15)でOpus級のコーディング性能を持つモデルが登場するわけだ。

Vision:3.75MP画像対応

Opus 4.7は「98.5%の視覚精度」と「3.75MP」の画像解像度を達成した。Sonnet 4.8はこの能力をミドルティア価格に持ち込むと予想される。

Sonnet 4.6の約1.25MPから3.75MPへ——3倍の解像度向上は、文書解析、UIモックアップ理解、チャート読み取りなどの実用性を大幅に向上させる。

新しい「xhigh」エフォートレベル

Opus 4.7で導入された「xhigh」エフォートレベル(highとmaxの間)がSonnet 4.8にも移植されるとみられる。

現在のエフォートレベル:low / medium / high / max

これにxhighが追加されることで、コストと性能のトレードオフをより細かく制御できるようになる。

トークナイザーの更新

Opus 4.7の新しいトークナイザーは、コンテンツタイプに応じて1.0〜1.35倍のトークンを生成する:

コンテンツタイプトークン増加率
英語散文~1.0倍(変化なし)
コード~1.1-1.2倍
構造化データ(JSON、XML)最大1.35倍

Sonnet 4.8がこのトークナイザーを採用した場合、実質的なコストが10-35%上昇する可能性がある。API価格は$3/$15のままでも、同じコンテンツがより多くのトークンに分割されるためだ。

Sonnet 4.6からの主な改善点

1. Vision能力の大幅強化

Opus 4.7から継承されるとみられる視覚能力:

  • 画像解像度:1.25MP → 3.75MP
  • 視覚精度:98.5%(Opus 4.7実測)
  • 文書スクリーンショット、UIモックアップ、チャートの高精度理解

2. コーディング性能の向上

Opus 4.7の改善実績:

  • CursorBench:58% → 70%(+12ポイント)
  • 93タスクコーディングベンチマーク:+13%
  • 本番環境タスク解決数:3倍

Sonnet 4.8はこれらの改善を$3/$15の価格帯にもたらす。

3. プロンプト解釈の変化

Opus 4.7は「4.6よりリテラルにプロンプトを解釈する」。Sonnet 4.8も同様の行動変化が予想される。より正確な指示遂行だが、曖昧な指示に対する柔軟性が低下する可能性もある。

価格:Sonnetティアの安定性

Sonnet系列の価格は、3.5から4.6まで一貫して$3/$15を維持してきた:

モデル入力/1M出力/1M
Claude 3.5 Sonnet$3$15
Claude 4 Sonnet$3$15
Claude Sonnet 4.5$3$15
Claude Sonnet 4.6$3$15
Claude Sonnet 4.8(予想)$3$15

一方、Opusティアは4.6で$5/$25に変更された(以前の$15/$75から大幅値下げ)。Sonnet 4.8が$3/$15を維持すれば、Opus 4.7の60%の価格で82-84%のSWE-bench性能を持つモデルになる。

関連するリーク情報

KAIROS

Claude Codeのリークコードに150回以上言及されているKAIROS——永続デーモンエージェント。自律監視、メモリ統合(「autoDream」)、先制アクション、プッシュ通知を含む。

Mythos

2026年4月7日リリース。SWE-bench Verifiedで93.9%。サイバーセキュリティ用途に限定(Project Glasswing)。

numbat

リークコード内で言及されているが、詳細不明の未リリースモデル。

開発者の期待

Sonnet 4.8への開発者の期待を集約すると:

  1. より長い信頼性の高い出力生成
  2. 過剰エンジニアリングの削減(不要な複雑さの追加)
  3. Time-to-First-Token(TTFT)の改善
  4. 大規模コードベースでのマルチファイル認識
  5. 安定したJSON/構造化出力と制約付きデコーディング

リリース時期

リーク情報に基づく予測:

シナリオ時期確率
ベストケース2026年4月下旬
最も可能性の高いケース2026年5月5-16日
ワーストケース2026年5月下旬

Opus 4.7が4月16日にリリースされたことを考えると、Sonnet 4.8は通常3-4週間後に続く。2026年5月中旬が最も可能性の高いリリース時期だ。

競合比較

Sonnet 4.8の位置づけ:

モデル入力/1M出力/1MSWE-bench特徴
Claude Sonnet 4.8(予想)$3$1582-84%Vision 3.75MP、1Mコンテキスト
Claude Sonnet 4.6$3$1579.6%現行主力
GPT-5.2$1.25$10.0080.0%OpenAI主力
DeepSeek V4 Pro (Max)$1.74$3.4880.6%最安フロンティア
Gemini 3.1 Pro$2.50$15.0080.6%Google主力
MiniMax M2.5$0.15$1.1580.2%コーディング特化・最安

Sonnet 4.8が82-84%を達成すれば、Sonnetティアで最強のコーディングモデルになる。$3/$15でOpus 4.5(80.9%)やOpus 4.6(80.8%)を上回る計算だ。

まとめ

Claude Sonnet 4.8は、AnthropicのSonnet系列にとって最大の飛躍になる可能性がある。

Opus 4.7のVision能力、コーディング性能、エフォートレベルを$3/$15の価格帯に持ち込む。SWE-bench Verifiedで82-84%を達成すれば、Opus級の性能をSonnet価格で提供するモデルが誕生する。

リーク情報に基づく予測だが、AnthropicのSonnet系列の歴史を振り返れば、この程度の改善は十分に現実的だ。正式発表を待つしかないが、開発者にとって最も注目すべきモデルの一つだ。

コメント (0)

シェア:Xはてブ

コメントを投稿

読み込み中...