モデル一覧に戻る
アリババオープンソース

Qwen-Image-2512

Qwen-Image-2512は、阿里巴巴が開発した多模态大模型(マルチモーダルモデル)です。約200Bのパラメータ規模を持ち、Apache 2.0ライセンスの下で公開されています。

パラメータ

200.0B

コンテキスト長

ライセンス

Apache 2.0

リリース日

2025-12-31

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 200Bの大規模パラメータ
  • 高度なマルチモーダル処理
  • オープンな利用ライセンス

弱み

  • 57.7GBの大きなファイル容量
  • 高い計算リソースを要求
  • 導入時のハードウェア制限

活用例

  • 高度な画像解析と理解
  • マルチモーダルAIアプリ開発
  • 大規模視覚言語タスク

深度分析

モデルタイプ

Text-to-Image Foundation Model

パラメータ

Not publicly disclosed

最大解像度

1664x928 (16:9)

推論ステップ

40 (default)

リリース日

December 2025

ライセンス

Apache 2.0

強み

  • AI Arenaブラインドテストにおける最強のオープンソース画像モデル
  • AI生成感を抑えた強化された人間のリアリズム
  • 風景やテクスチャのより繊細な自然なディテール
  • テキストレンダリングの精度とレイアウトの改善
  • クローズドソースモデルに対して競争力あり

弱み

  • 40ステップの推論はリアルタイムアプリケーションには遅い可能性がある
  • モデルサイズが大きく大量のGPUメモリを必要とする
  • 主に中国市場向けに最適化されている
  • 最良の結果を得るにはネガティブプロンプトが必要
  • 英語のドキュメントやコミュニティが限定的

競合比較

ModelArenaSWEGPQAPrice
Stable Diffusion 3.5 LargeN/AN/AN/AOpen source
FLUX 1.1 ProN/AN/AN/A$0.04/image
DALL-E 3N/AN/AN/A$0.04-0.12/image
Midjourney v6N/AN/AN/A$10-60/month

Qwen-Image-2512 は、アリババの Qwen-Image テキストから画像生成の基盤モデルの2025年12月アップデートです。AI Arena での1万回以上のブラインドテストにより、これは最強のオープンソース画像モデルであることが示されており、クローズドソースの代替品とも競争力を保っています。主な改善点には、人間のリアリズムの向上、より精緻な自然のディテール、およびテキストレンダリングの改善が含まれます。

分析生成日: 2026-05-30