ブログ一覧に戻る
ベンチマーク

2026年5月 AI API料金完全比較:全フロンティアモデルの価格一覧

AI APIの料金は、2026年に入り急速に変動している。

2025年初頭には「フロンティアモデル = 高価」という認識が一般的だった。しかし2026年5月現在、SWE-bench性能が80%を超えるモデルが$0.30/$1.20で利用可能になっている。

2026年5月時点の主要モデルのAPI料金を整理する。

フロンティアモデル(SWE-bench 80%超)

モデル開発元入力/1M出力/1MSWE-benchコンテキストウィンドウ
Claude Mythos PreviewAnthropic非公開非公開93.9%1M
Claude Opus 4.7Anthropic$5.00$25.0087.6%200K
Claude Opus 4.6Anthropic$5.00$25.0080.8%1M
Gemini 3.1 ProGoogle$2.50$15.0080.6%1M
DeepSeek V4 Pro (Max)DeepSeek$1.74$3.4880.6%1M
Kimi K2.6Moonshot AI$0.95$4.0080.2%256K
MiniMax M2.5MiniMax$0.30$1.2080.2%200K
GPT-5.2OpenAI$1.25$10.0080.0%256K

高性能モデル(SWE-bench 75-80%)

モデル開発元入力/1M出力/1MSWE-benchコンテキストウィンドウ
Claude Sonnet 4.6Anthropic$3.00$15.0079.6%1M
DeepSeek V4 Flash (Max)DeepSeek$0.14$0.2879.0%1M
Qwen3.6 PlusAlibaba$0.50$3.0078.8%1M
MiMo-V2-ProXiaomi$0.50$3.0078.0%1M
Mistral Medium 3.5Mistral$1.50$7.5077.6%256K
GLM-5Zhipu AI$1.00$3.2077.8%200K

コストパフォーマンス最強モデル

SWE-benchスコアを出力価格で割った「スコア/ドル」で比較する:

モデルスコア出力/1Mスコア/ドル特徴
DeepSeek V4 Flash (Max)79.0%$0.28282.1圧倒的コスパ
MiniMax M2.580.2%$1.2066.8トップ10入りの最安
DeepSeek V4 Pro (Max)80.6%$3.4823.2フロンティア最安クラス
Kimi K2.680.2%$4.0020.1Moonshot AI主力
Qwen3.6 Plus78.8%$3.0026.3Alibaba主力
MiMo-V2-Pro78.0%$3.0026.0Xiaomi主力
GPT-5.280.0%$10.008.0OpenAI主力
Gemini 3.1 Pro80.6%$15.005.4Google主力
Claude Sonnet 4.679.6%$15.005.3Anthropic主力
Claude Opus 4.787.6%$25.003.5最高性能クラス

DeepSeek V4 Flash (Max)のコスパは群を抜いている。79.0%のスコアを$0.28の出力価格で達成し、スコア/ドルは282.1だ。Opus 4.7の3.5と比べて80倍のコストパフォーマンスを誇る。

月額コスト試算

月間1,000万トークン(入力5M + 出力5M)を利用した場合のコスト:

モデル月額コスト用途
DeepSeek V4 Flash (Max)$2.10軽量タスク
MiniMax M2.5$7.50コーディング
DeepSeek V4 Pro (Max)$26.10フロンティア
Kimi K2.6$24.75フロンティア
GPT-5.2$56.25OpenAI主力
Gemini 3.1 Pro$87.50Google主力
Claude Sonnet 4.6$90.00Anthropic主力
Claude Opus 4.7$150.00最高性能

月間1,000万トークンの利用で、最安(DeepSeek V4 Flash)と最高(Opus 4.7)の差は71倍に達する。

キャッシュ価格の重要性

一部のモデルはキャッシュ入力価格を提供している:

モデル通常入力キャッシュ入力割引率
Gemini 3.5 Flash$1.50$0.1590%
Gemini 3.1 Pro$2.50$0.25(推定)90%
DeepSeek V4 Pro$1.74$0.4475%
MiniMax M2.7$0.30$0.0680%

キャッシュはエージェントワークロードにおいて圧倒的なコスト削減を実現する。同じコンテキストを繰り返し読み込むエージェントの場合、キャッシュ価格を利用することでコストを10分の1以下に抑えられる。

特にGemini 3.5 Flashの$0.15/1Mというキャッシュ価格は、エージェント用途において極めてコスト効率の高い選択肢となる。

価格変動の歴史

2025年から2026年にかけての主要モデルの価格推移:

モデル2025年初2025年末2026年5月変化
Claude Opus$15/$75$5/$25$5/$25入力67%減
GPT-4o$5/$15GPT-5.2に移行
GPT-5.2$1.25/$10新価格帯
Gemini Pro$7/$21$2.50/$15$2.50/$15入力64%減
DeepSeek V4$1.74/$3.48新参入

入力価格の下落傾向が顕著だ。2025年初のClaude Opus($15/$75)と現在のOpus 4.7($5/$25)を比較すると、入力価格は3分の1まで低下している。

一方で、出力価格の下落は緩やかである。モデルの出力品質が向上するにつれ、出力トークンあたりの価値が高まっているためと考えられる。

モデル選択ガイド

用途別のおすすめモデル:

用途おすすめモデル理由
コーディング(最高品質)Claude Opus 4.7SWE-bench 87.6%
コーディング(コスパ)MiniMax M2.580.2%で$0.30/$1.20
コーディング(最安)DeepSeek V4 Flash79.0%で$0.14/$0.28
長文処理Gemini 3.1 Pro1Mコンテキストウィンドウ
エージェントGemini 3.5 Flashキャッシュ$0.15、4倍速
推論・数学GPT-5.5 ProFrontierMath最高
日本語Claude Sonnet 4.6日本語品質が高い
ローカル展開DeepSeek V4オープンソース
予算制限ありMiniMax M2.5トップ10最安

2026年後半の見通し

価格はさらに下落するだろう。DeepSeek V4 Flashの$0.14/$0.28という水準は、すでに「コストを気にする必要がない」領域に到達しており、他のプロバイダーも追随することが予想される。

キャッシュ価格が競争の新たな主戦場になる。エージェントワークロードの増加に伴い、キャッシュ価格の差が直接的にコスト効率に影響するためだ。

「最安」と「最高」の格差はさらに拡大する。SWE-bench 93.9%のMythosと79.0%のDeepSeek V4 Flashの間には、価格で100倍以上の開きがある。ユーザーは品質とコストのトレードオフをより精密に管理する必要がある。

まとめ

2026年5月のAI API市場は、かつてないほど多様化している。

$0.14/$0.28のDeepSeek V4 Flashから非公開価格のClaude Mythosまで、月間1,000万トークンあたりのコストは$2.10から$150まで幅広くなっている。

「最安のモデル」と「最高のモデル」の性能差は急速に縮小しており、SWE-benchで80%を超えるモデルが$0.30/$1.20で利用可能になったことは、AI APIの民主化が現実のものとなったことを示している。

今後のモデル選択は、「どのモデルが最も優れているか」ではなく、「どのモデルが自分の用途に最も最適か」という視点へと転換すべきである。

コメント (0)

シェア:Xはてブ

コメントを投稿

読み込み中...