モデル一覧に戻る
アリババオープンソース
Qwen-Image-2512
Qwen-Image-2512は、阿里巴巴が開発した多模态大模型(マルチモーダルモデル)です。約200Bのパラメータ規模を持ち、Apache 2.0ライセンスの下で公開されています。
パラメータ
200.0B
コンテキスト長
ライセンス
Apache 2.0
リリース日
2025-12-31
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・200Bの大規模パラメータ
- ・高度なマルチモーダル処理
- ・オープンな利用ライセンス
弱み
- ・57.7GBの大きなファイル容量
- ・高い計算リソースを要求
- ・導入時のハードウェア制限
活用例
- ・高度な画像解析と理解
- ・マルチモーダルAIアプリ開発
- ・大規模視覚言語タスク
深度分析
モデルタイプ
Text-to-Image Foundation Model
パラメータ
Not publicly disclosed
最大解像度
1664x928 (16:9)
推論ステップ
40 (default)
リリース日
December 2025
ライセンス
Apache 2.0
強み
- ・AI Arenaブラインドテストにおける最強のオープンソース画像モデル
- ・AI生成感を抑えた強化された人間のリアリズム
- ・風景やテクスチャのより繊細な自然なディテール
- ・テキストレンダリングの精度とレイアウトの改善
- ・クローズドソースモデルに対して競争力あり
弱み
- ・40ステップの推論はリアルタイムアプリケーションには遅い可能性がある
- ・モデルサイズが大きく大量のGPUメモリを必要とする
- ・主に中国市場向けに最適化されている
- ・最良の結果を得るにはネガティブプロンプトが必要
- ・英語のドキュメントやコミュニティが限定的
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Stable Diffusion 3.5 Large | N/A | N/A | N/A | Open source |
| FLUX 1.1 Pro | N/A | N/A | N/A | $0.04/image |
| DALL-E 3 | N/A | N/A | N/A | $0.04-0.12/image |
| Midjourney v6 | N/A | N/A | N/A | $10-60/month |
Qwen-Image-2512 は、アリババの Qwen-Image テキストから画像生成の基盤モデルの2025年12月アップデートです。AI Arena での1万回以上のブラインドテストにより、これは最強のオープンソース画像モデルであることが示されており、クローズドソースの代替品とも競争力を保っています。主な改善点には、人間のリアリズムの向上、より精緻な自然のディテール、およびテキストレンダリングの改善が含まれます。
出典
分析生成日: 2026-05-30