Back to Blog
オープンソース

Qwen3.7-PlusとQwen3.7-Maxの違いとは?画像理解が必要な場合の選択指針

2026年5月20日、Alibaba CloudのApsara SummitでQwen3.7シリーズが正式発表された。Qwen3.7にはMaxPlusの2つのモデルがあり、それぞれ異なる特性を持つ。

「結局、自分の用途にはどちらを選べばいいのか」という疑問に答えるため、公開されているデータを整理した。

MaxとPlus、最も重要な違いは「画像理解」

Qwen3.7-MaxとQwen3.7-Plusの決定的な差異はマルチモーダル対応である。

項目Qwen3.7-MaxQwen3.7-Plus
モダリティテキストのみテキスト + 画像
コンテキストウィンドウ1,000,000トークン1,000,000トークン
最大出力65,536トークン65,536トークン
Thinkingモード対応対応
関数呼び出し対応対応
組み込みツールWeb検索、コードインタープリター未対応
API公開状態一般公開プレビュー段階

Plusはスクリーンショットの理解、ドキュメント解析、UIエージェントフロー、画像ベースのQ&Aに対応する。Maxはテキスト専用だが、純粋な推論・コーディング性能では上回る。

ベンチマーク比較:Maxがリードするテキスト性能

Qwen3.7-Maxのベンチマークスコアは圧倒的だ:

ベンチマークQwen3.7-MaxClaude Opus 4.6GPT-5.4 Pro
GPQA Diamond92.4%91.3%94.4%
SWE-bench Verified80.4%80.8%
SWE-bench Pro60.6%
Terminal-Bench 2.069.7%
HMMT 202697.1%
LiveCodeBench91.6

Maxはテキスト系ベンチマークで中国モデル中トップ(Arena Elo 1475、テキスト全体で13位)である。一方、Plus-PreviewはVision部門でLM Arena 16位にランクインしており、マルチモーダル能力を実証している。

ただし、Plus単独のベンチマークスコアはまだ限定的だ。プレビュー段階のため、今後の正式リリースで数値が公開される可能性がある。

価格とコスト構造

項目Qwen3.7-MaxQwen3.7-Plus
入力/1Mトークン$2.50未定(プレビュー)
出力/1Mトークン$7.50未定(プレビュー)
キャッシュヒット時入力$0.25

Maxの$2.50/$7.50という価格は、Claude Opus 4.7($5/$25)の約3分の1だ。GPQA DiamondでOpus 4.6を上回りながら、コストを大幅に抑えている。

Plusの正式価格は未発表だが、Maxと同程度か、あるいはさらに安くなる可能性がある。プレビュー段階では無料でテスト可能だ。

どちらを選ぶべきか:用途別ガイドライン

Qwen3.7-Maxを選ぶべき場合:

  • コーディングタスク(SWE-bench 80.4%、SWE-bench Pro 60.6%)
  • 数学・科学推論(GPQA Diamond 92.4%、HMMT 97.1%)
  • 長時間エージェント実行(35時間自律実行、1,158回ツール呼び出し)
  • 組み込みWeb検索やコードインタープリターが必要な場合
  • コストパフォーマンス重視($2.50/$7.50)

Qwen3.7-Plusを選ぶべき場合:

  • スクリーンショットや画像の理解が必要
  • ドキュメント解析(PDF、図表、チャートの読み取り)
  • UIエージェントフロー(画面を見ながら操作するAI)
  • 画像を含むマルチモーダルな推論タスク
  • Vision AIの開発・テスト

「両方使う」という選択肢

実際の開発シーンでは、MaxとPlusを使い分けるのが最も効率的だ。

例えば、コードレビューやバグ修正にはMax(テキスト推論が強み)を使い、UIのスクリーンショットからバグを特定するにはPlus(画像理解が強み)を使うといった使い分けが可能になる。

Qwen3.7のもう一つの強みは、Anthropic APIとの互換性だ。Claude Codeや既存のClaude向けツールをそのままQwenに切り替えられるため、マルチモデル戦略の導入コストが低い。

まとめ

要件推奨モデル
テキスト推論・コーディングQwen3.7-Max
画像理解・マルチモーダルQwen3.7-Plus
最高性能(予算無制限)Claude Opus 4.7
最高コスパDeepSeek V4 Flash

Qwen3.7シリーズの最大の強みは、MaxとPlusの2モデル体制で「テキスト専用の深さ」と「マルチモーダルの幅」をカバーしている点だ。どちらか一方が「最強」なのではなく、用途に応じて選ぶことが重要である。

Comments (0)

Share:XHatena

Post a Comment

Loading...