オープンソース2026-05-28

Qwen3.7-PlusとQwen3.7-Maxの違いとは？画像理解が必要な場合の選択指針

2026年5月20日、Alibaba CloudのApsara SummitでQwen3.7シリーズが正式発表された。Qwen3.7にはMaxとPlusの2つのモデルがあり、それぞれ異なる特性を持つ。

「結局、自分の用途にはどちらを選べばいいのか」という疑問に答えるため、公開されているデータを整理した。

MaxとPlus、最も重要な違いは「画像理解」

Qwen3.7-MaxとQwen3.7-Plusの決定的な差異はマルチモーダル対応である。

Plusはスクリーンショットの理解、ドキュメント解析、UIエージェントフロー、画像ベースのQ&Aに対応する。Maxはテキスト専用だが、純粋な推論・コーディング性能では上回る。

Qwen3.7-Maxのベンチマークスコアは圧倒的だ：

ベンチマーク	Qwen3.7-Max	Claude Opus 4.6	GPT-5.4 Pro
GPQA Diamond	92.4%	91.3%	94.4%
SWE-bench Verified	80.4%	80.8%	—
SWE-bench Pro	60.6%	—	—
Terminal-Bench 2.0	69.7%	—	—
HMMT 2026	97.1%	—	—
LiveCodeBench	91.6	—	—

Maxはテキスト系ベンチマークで中国モデル中トップ（Arena Elo 1475、テキスト全体で13位）である。一方、Plus-PreviewはVision部門でLM Arena 16位にランクインしており、マルチモーダル能力を実証している。

ただし、Plus単独のベンチマークスコアはまだ限定的だ。プレビュー段階のため、今後の正式リリースで数値が公開される可能性がある。

Maxの$2.50/$7.50という価格は、Claude Opus 4.7（$5/$25）の約3分の1だ。GPQA DiamondでOpus 4.6を上回りながら、コストを大幅に抑えている。

Plusの正式価格は未発表だが、Maxと同程度か、あるいはさらに安くなる可能性がある。プレビュー段階では無料でテスト可能だ。

Qwen3.7-Maxを選ぶべき場合：

Qwen3.7-Plusを選ぶべき場合：

実際の開発シーンでは、MaxとPlusを使い分けるのが最も効率的だ。

例えば、コードレビューやバグ修正にはMax（テキスト推論が強み）を使い、UIのスクリーンショットからバグを特定するにはPlus（画像理解が強み）を使うといった使い分けが可能になる。

Qwen3.7のもう一つの強みは、Anthropic APIとの互換性だ。Claude Codeや既存のClaude向けツールをそのままQwenに切り替えられるため、マルチモデル戦略の導入コストが低い。

Qwen3.7シリーズの最大の強みは、MaxとPlusの2モデル体制で「テキスト専用の深さ」と「マルチモーダルの幅」をカバーしている点だ。どちらか一方が「最強」なのではなく、用途に応じて選ぶことが重要である。

シェア:X はてブ

読み込み中...