モデル一覧に戻る
Zhipu AIオープンソース

GLM-Image

GLM-Imageは、智谱AIによって開発された視覚大模型です。約160Bのパラメータ規模を持ち、MITライセンスの下で公開されているオープンなマルチモーダルモデルです。

パラメータ

160.0B

コンテキスト長

4K

ライセンス

MIT

リリース日

2026-01-14

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 160Bの大規模なパラメータ
  • MITライセンスによる開放性
  • 高度な視覚理解能力

弱み

  • 4Kという限定的な文脈長
  • 35.8GBの大きなファイルサイズ
  • 高い計算リソースの必要性

活用例

  • 高度な画像解析と理解
  • 視覚情報の抽出と処理
  • マルチモーダルAI開発

深度分析

Architecture

Autoregressive (9B) + Diffusion (7B)

CVTG-2K Word Accuracy

0.9116

#1 open-source

LongText-Bench EN

0.9524

#1 open-source

LongText-Bench CN

0.9788

#1 open-source

Price

$0.015 per image

License

Apache 2.0

Release Date

January 9, 2026

強み

  • Open-source SOTA text rendering (#1 CVTG-2K, LongText-Bench)
  • Hybrid architecture combines semantics + detail
  • Excels at knowledge-intensive generation
  • Very affordable ($0.015/image)

弱み

  • General quality matches but doesn't surpass mainstream models
  • Max 2048px resolution
  • Smaller community (912 GitHub stars)

競合比較

ModelPrice
DALL-E 3$0.04-$0.08/image
Midjourney v6Subscription
Stable Diffusion 3Free (self-host)

GLM-Imageは、ハイブリッド型の自己回帰+拡散画像生成モデルです。テキスト描画精度においてオープンソース第1位。$0.015/画像、Apache 2.0。

出典

分析生成日: 2026-05-24