Qwen3.5-122B-A10B
Qwen3.5-122B-A10Bは、阿里巴巴が開発した推論モデルです。約1220.0Bという大規模なパラメータ数と、262Kの長いコンテキストウィンドウを備えています。
パラメータ
1220.0B
コンテキスト長
262K
ライセンス
https://huggingface.co/Qwen/Qwen2.5-72B/blob/main/LICENSE
リリース日
2026-02-25
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・1.2兆超の膨大なパラメータ数
- ・262Kの非常に長い文脈理解
- ・高度な推論能力の実現
弱み
- ・クローズドなライセンス形態
- ・巨大なモデルによる計算コスト
- ・利用制限のあるライセンス
活用例
- ・複雑な論理的推論タスク
- ・超長文ドキュメントの解析
- ・高度な知識集約型タスク
深度分析
リリース日
February 2026
総パラメータ数
122B
MoE architecture
アクティブパラメータ
10B per token
256 experts with selective activation
コンテキストウィンドウ
262,144 tokens
アーキテクチャ
Hybrid MoE: Gated DeltaNet + Gated Attention
モダリティ
Text, Image, Video
VRAM(Q4)
~70 GB
VRAM(BF16)
~244 GB
ライセンス
Apache 2.0
API価格
Available via DashScope, SiliconFlow, DeepInfra
強み
- ・高い品質対計算コスト比:100億のアクティブパラメータで最先端に迫る性能
- ・同一の重みでテキスト・画像・動画をネイティブサポートするマルチモーダルモデル
- ・Q4(約70GB VRAM)でコンシューマー向けマルチGPU環境に対応し、本気の愛好家にも実用的
- ・ハイブリッドDeltaNetアーキテクチャによる26.2万トークンのネイティブコンテキストで高速な長文脈推論を実現
- ・Apache 2.0ライセンスにより商用利用とファインチューニングが可能
弱み
- ・397Bフラッグシップと35B-A3Bスピードモデルの間で中途半端な位置づけ
- ・Q4で70GBのVRAMは依然としてマルチGPU構成を必要とする(2x RTX 4090以上)
- ・専用のベンチマークスポットライトがない — マーケティングで397Bと9Bの影に隠れている
- ・アクティブパラメータ(10B)は最も要求の厳しい推論タスクには不十分かもしれない
- ・コミュニティでの採用は9B、27B、35B-A3Bと比較して遅れている
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Qwen3.5-397B-A17B | ~1450 | 76.4 | 88.4 | $0.40/$2.40 |
| Qwen3.5-27B | ~1400 | ~68 | 85.5 | Open-source |
| Llama 4 Scout | ~1380 | ~65 | ~80 | Open-source |
| Qwen3.5-122B-A10B | ~1420 | ~72 | ~86 | Open-source |
| DeepSeek V3 | ~1410 | ~70 | ~82 | $0.14/$0.28 |
Qwen3.5-122B-A10Bは、Qwen3.5ファミリーの中級MoEモデルであり、総パラメータ数122B、トークンあたり10Bのアクティブパラメータを有します。品質と推論効率の優れたバランスを実現し、Q4量子化時に約70GBのVRAMでマルチGPUセットアップに収まります。2026年2月にApache 2.0ライセンスでリリースされ、ネイティブにマルチモーダルであり、より大きな兄弟モデルと同じハイブリッドDeltaNetアーキテクチャを採用しています。
出典
分析生成日: 2026-05-30