모델 목록으로
Zhipu AI오픈소스

GLM-Image

GLM-Image는 Zhipu AI가 개발한 시각적 대형 모델입니다. 약 160B의 파라미터 규모를 가지며, MIT 라이선스 하에 출시된 개방형 멀티모달 모델입니다.

파라미터

160.0B

컨텍스트

4K

라이선스

MIT

출시일

2026-01-14

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 대규모 160B 파라미터
  • MIT 라이선스를 통한 개방성
  • 고급 시각 이해 능력

약점

  • 제한적인 4K 컨텍스트 길이
  • 대용량 35.8GB 파일 크기
  • 높은 연산 자원 요구사항

활용 사례

  • 고급 이미지 분석 및 이해
  • 시각 정보 추출 및 처리
  • 멀티모달 AI 개발

심층 분석

Architecture

Autoregressive (9B) + Diffusion (7B)

CVTG-2K Word Accuracy

0.9116

#1 open-source

LongText-Bench EN

0.9524

#1 open-source

LongText-Bench CN

0.9788

#1 open-source

Price

$0.015 per image

License

Apache 2.0

Release Date

January 9, 2026

강점

  • Open-source SOTA text rendering (#1 CVTG-2K, LongText-Bench)
  • Hybrid architecture combines semantics + detail
  • Excels at knowledge-intensive generation
  • Very affordable ($0.015/image)

약점

  • General quality matches but doesn't surpass mainstream models
  • Max 2048px resolution
  • Smaller community (912 GitHub stars)

경쟁사 비교

ModelPrice
DALL-E 3$0.04-$0.08/image
Midjourney v6Subscription
Stable Diffusion 3Free (self-host)

GLM-Image is a hybrid autoregressive+diffusion image generator. #1 open-source in text rendering accuracy. $0.015/image, Apache 2.0.

출처

분석 생성일: 2026-05-24