Anthropic2026-05-26

Claude Sonnet 4.8のリークから判明した次期主力モデルの全貌と性能予測

2026年3月31日、Claude Codeのnpmパッケージ（v2.1.88）の中に「sonnet-4-8」という文字列が発見された。

Anthropicは公式発表していない。しかしリークされた情報から、Sonnet 4.8の輪郭はかなり鮮明になっている。

バージョン番号の謎：なぜ4.7を飛ばして4.8なのか

AnthropicのSonnet系列は、これまで一定のペースでバージョンアップしてきた：

モデル	リリース	API文字列
Claude 3.5 Sonnet	2024年6月	claude-3-5-sonnet-20240620
Claude 3.7 Sonnet	2025年2月	claude-3-7-sonnet-20250219
Claude 4 Sonnet	2025年5月	claude-sonnet-4-0
Claude Sonnet 4.5	2025年9月	claude-sonnet-4-5
Claude Sonnet 4.6	2026年2月	claude-sonnet-4-6
Claude Sonnet 4.8	2026年5月（予想）	claude-sonnet-4-8

4.7を飛ばして4.8になることは、Opus 4.7からの単純移植ではないことを示唆している。異なる時間軸、異なる学習ランで開発された可能性がある。

予想されるスペック

リーク情報とOpus 4.7の改善率からの予測：

項目	Sonnet 4.6（現在）	Sonnet 4.8（予想）
SWE-bench Verified	79.6%	82-84%
GPQA Diamond	74.1%	76-78%
画像解像度上限	~1.25MP	3.75MP（3倍）
コンテキストウィンドウ	1M（ベータ）	1M（GAの可能性）
価格（入力/出力）	$3/$15	$3/$15（変更なしの可能性）
知識カットオフ	2025年8月	2025年末〜2026年初頭

SWE-bench Verified：82-84%の根拠

Sonnet 4.6はSWE-bench Verifiedで79.6%を記録。Opus 4.6（80.8%）とほぼ同等だった。Opus 4.7は87.6%に到達し、Opus 4.6比で約7ポイントの改善を見せた。

Sonnet 4.8が同程度の改善幅（6-8ポイント）をSonnet 4.6から得れば、**82-84%**は妥当な予測になる。

参考：2026年5月25日時点のSWE-bench Verifiedランキング上位：

順位	モデル	スコア
1	Claude Mythos Preview	93.9%
2	Claude Opus 4.7	87.6%
3	GPT-5.3 Codex	85.0%
4	Claude Opus 4.5	80.9%
5	Claude Opus 4.6	80.8%
5	DeepSeek V4 Pro (Max)	80.6%
7	Gemini 3.1 Pro	80.6%
8	Kimi K2.6	80.2%
8	MiniMax M2.5	80.2%
10	Claude Sonnet 4.6	79.6%

Sonnet 4.8が82-84%を達成すれば、Opus 4.5やOpus 4.6を上回り、Opus 4.7に近づくことになる。Sonnetティア（$3/$15）でOpus級のコーディング性能を持つモデルが登場するわけだ。

Vision：3.75MP画像対応

Opus 4.7は「98.5%の視覚精度」と「3.75MP」の画像解像度を達成した。Sonnet 4.8はこの能力をミドルティア価格に持ち込むと予想される。

Sonnet 4.6の約1.25MPから3.75MPへ——3倍の解像度向上は、文書解析、UIモックアップ理解、チャート読み取りなどの実用性を大幅に向上させる。

新しい「xhigh」エフォートレベル

Opus 4.7で導入された「xhigh」エフォートレベル（highとmaxの間）がSonnet 4.8にも移植されるとみられる。

現在のエフォートレベル：low / medium / high / max

これにxhighが追加されることで、コストと性能のトレードオフをより細かく制御できるようになる。

トークナイザーの更新

Opus 4.7の新しいトークナイザーは、コンテンツタイプに応じて1.0〜1.35倍のトークンを生成する：

コンテンツタイプ	トークン増加率
英語散文	~1.0倍（変化なし）
コード	~1.1-1.2倍
構造化データ（JSON、XML）	最大1.35倍

Sonnet 4.8がこのトークナイザーを採用した場合、実質的なコストが10-35%上昇する可能性がある。API価格は$3/$15のままでも、同じコンテンツがより多くのトークンに分割されるためだ。

Sonnet 4.6からの主な改善点

1. Vision能力の大幅強化

Opus 4.7から継承されるとみられる視覚能力：

画像解像度：1.25MP → 3.75MP
視覚精度：98.5%（Opus 4.7実測）
文書スクリーンショット、UIモックアップ、チャートの高精度理解

2. コーディング性能の向上

Opus 4.7の改善実績：

CursorBench：58% → 70%（+12ポイント）
93タスクコーディングベンチマーク：+13%
本番環境タスク解決数：3倍

Sonnet 4.8はこれらの改善を$3/$15の価格帯にもたらす。

3. プロンプト解釈の変化

Opus 4.7は「4.6よりリテラルにプロンプトを解釈する」。Sonnet 4.8も同様の行動変化が予想される。より正確な指示遂行だが、曖昧な指示に対する柔軟性が低下する可能性もある。

価格：Sonnetティアの安定性

Sonnet系列の価格は、3.5から4.6まで一貫して$3/$15を維持してきた：

モデル	入力/1M	出力/1M
Claude 3.5 Sonnet	$3	$15
Claude 4 Sonnet	$3	$15
Claude Sonnet 4.5	$3	$15
Claude Sonnet 4.6	$3	$15
Claude Sonnet 4.8（予想）	$3	$15

一方、Opusティアは4.6で$5/$25に変更された（以前の$15/$75から大幅値下げ）。Sonnet 4.8が$3/$15を維持すれば、Opus 4.7の60%の価格で82-84%のSWE-bench性能を持つモデルになる。

開発者の期待

Sonnet 4.8への開発者の期待を集約すると：

より長い信頼性の高い出力生成
過剰エンジニアリングの削減（不要な複雑さの追加）
Time-to-First-Token（TTFT）の改善
大規模コードベースでのマルチファイル認識
安定したJSON/構造化出力と制約付きデコーディング

リリース時期

リーク情報に基づく予測：

シナリオ	時期	確率
ベストケース	2026年4月下旬	低
最も可能性の高いケース	2026年5月5-16日	中
ワーストケース	2026年5月下旬	中

Opus 4.7が4月16日にリリースされたことを考えると、Sonnet 4.8は通常3-4週間後に続く。2026年5月中旬が最も可能性の高いリリース時期だ。

競合比較

Sonnet 4.8の位置づけ：

モデル	入力/1M	出力/1M	SWE-bench	特徴
Claude Sonnet 4.8（予想）	$3	$15	82-84%	Vision 3.75MP、1Mコンテキスト
Claude Sonnet 4.6	$3	$15	79.6%	現行主力
GPT-5.2	$1.25	$10.00	80.0%	OpenAI主力
DeepSeek V4 Pro (Max)	$1.74	$3.48	80.6%	最安フロンティア
Gemini 3.1 Pro	$2.50	$15.00	80.6%	Google主力
MiniMax M2.5	$0.15	$1.15	80.2%	コーディング特化・最安

Sonnet 4.8が82-84%を達成すれば、Sonnetティアで最強のコーディングモデルになる。$3/$15でOpus 4.5（80.9%）やOpus 4.6（80.8%）を上回る計算だ。

まとめ

Claude Sonnet 4.8は、AnthropicのSonnet系列にとって最大の飛躍になる可能性がある。

Opus 4.7のVision能力、コーディング性能、エフォートレベルを$3/$15の価格帯に持ち込む。SWE-bench Verifiedで82-84%を達成すれば、Opus級の性能をSonnet価格で提供するモデルが誕生する。

リーク情報に基づく予測だが、AnthropicのSonnet系列の歴史を振り返れば、この程度の改善は十分に現実的だ。正式発表を待つしかないが、開発者にとって最も注目すべきモデルの一つだ。

[Anthropicが「Claude Opus 4.7」をリリース：コーディング能力と視覚解像度が大幅向上、初のサイバーセキュリティ保護機能を搭載](/blog/anthropic-claude-opus-4-7-software-engineering)
SWE-bench Verified 2026最新ランキング：90モデルのコーディング性能を徹底比較
【2026年5月版】主要AIモデルAPI料金の完全比較一覧

コメント (0)

シェア:X はてブ

読み込み中...

ブログ一覧に戻る