Qwen3.7-PlusとQwen3.7-Maxの違いとは?画像理解が必要な場合の選択指針
2026年5月20日、Alibaba CloudのApsara SummitでQwen3.7シリーズが正式発表された。Qwen3.7にはMaxとPlusの2つのモデルがあり、それぞれ異なる特性を持つ。
「結局、自分の用途にはどちらを選べばいいのか」という疑問に答えるため、公開されているデータを整理した。
MaxとPlus、最も重要な違いは「画像理解」
Qwen3.7-MaxとQwen3.7-Plusの決定的な差異はマルチモーダル対応である。
| 項目 | Qwen3.7-Max | Qwen3.7-Plus |
|---|---|---|
| モダリティ | テキストのみ | テキスト + 画像 |
| コンテキストウィンドウ | 1,000,000トークン | 1,000,000トークン |
| 最大出力 | 65,536トークン | 65,536トークン |
| Thinkingモード | 対応 | 対応 |
| 関数呼び出し | 対応 | 対応 |
| 組み込みツール | Web検索、コードインタープリター | 未対応 |
| API公開状態 | 一般公開 | プレビュー段階 |
Plusはスクリーンショットの理解、ドキュメント解析、UIエージェントフロー、画像ベースのQ&Aに対応する。Maxはテキスト専用だが、純粋な推論・コーディング性能では上回る。
ベンチマーク比較:Maxがリードするテキスト性能
Qwen3.7-Maxのベンチマークスコアは圧倒的だ:
| ベンチマーク | Qwen3.7-Max | Claude Opus 4.6 | GPT-5.4 Pro |
|---|---|---|---|
| GPQA Diamond | 92.4% | 91.3% | 94.4% |
| SWE-bench Verified | 80.4% | 80.8% | — |
| SWE-bench Pro | 60.6% | — | — |
| Terminal-Bench 2.0 | 69.7% | — | — |
| HMMT 2026 | 97.1% | — | — |
| LiveCodeBench | 91.6 | — | — |
Maxはテキスト系ベンチマークで中国モデル中トップ(Arena Elo 1475、テキスト全体で13位)である。一方、Plus-PreviewはVision部門でLM Arena 16位にランクインしており、マルチモーダル能力を実証している。
ただし、Plus単独のベンチマークスコアはまだ限定的だ。プレビュー段階のため、今後の正式リリースで数値が公開される可能性がある。
価格とコスト構造
| 項目 | Qwen3.7-Max | Qwen3.7-Plus |
|---|---|---|
| 入力/1Mトークン | $2.50 | 未定(プレビュー) |
| 出力/1Mトークン | $7.50 | 未定(プレビュー) |
| キャッシュヒット時入力 | $0.25 | — |
Maxの$2.50/$7.50という価格は、Claude Opus 4.7($5/$25)の約3分の1だ。GPQA DiamondでOpus 4.6を上回りながら、コストを大幅に抑えている。
Plusの正式価格は未発表だが、Maxと同程度か、あるいはさらに安くなる可能性がある。プレビュー段階では無料でテスト可能だ。
どちらを選ぶべきか:用途別ガイドライン
Qwen3.7-Maxを選ぶべき場合:
- コーディングタスク(SWE-bench 80.4%、SWE-bench Pro 60.6%)
- 数学・科学推論(GPQA Diamond 92.4%、HMMT 97.1%)
- 長時間エージェント実行(35時間自律実行、1,158回ツール呼び出し)
- 組み込みWeb検索やコードインタープリターが必要な場合
- コストパフォーマンス重視($2.50/$7.50)
Qwen3.7-Plusを選ぶべき場合:
- スクリーンショットや画像の理解が必要
- ドキュメント解析(PDF、図表、チャートの読み取り)
- UIエージェントフロー(画面を見ながら操作するAI)
- 画像を含むマルチモーダルな推論タスク
- Vision AIの開発・テスト
「両方使う」という選択肢
実際の開発シーンでは、MaxとPlusを使い分けるのが最も効率的だ。
例えば、コードレビューやバグ修正にはMax(テキスト推論が強み)を使い、UIのスクリーンショットからバグを特定するにはPlus(画像理解が強み)を使うといった使い分けが可能になる。
Qwen3.7のもう一つの強みは、Anthropic APIとの互換性だ。Claude Codeや既存のClaude向けツールをそのままQwenに切り替えられるため、マルチモデル戦略の導入コストが低い。
まとめ
| 要件 | 推奨モデル |
|---|---|
| テキスト推論・コーディング | Qwen3.7-Max |
| 画像理解・マルチモーダル | Qwen3.7-Plus |
| 最高性能(予算無制限) | Claude Opus 4.7 |
| 最高コスパ | DeepSeek V4 Flash |
Qwen3.7シリーズの最大の強みは、MaxとPlusの2モデル体制で「テキスト専用の深さ」と「マルチモーダルの幅」をカバーしている点だ。どちらか一方が「最強」なのではなく、用途に応じて選ぶことが重要である。
読み込み中...