모델 목록으로
Zhipu AI오픈소스
GLM-Image
GLM-Image는 Zhipu AI가 개발한 시각적 대형 모델입니다. 약 160B의 파라미터 규모를 가지며, MIT 라이선스 하에 출시된 개방형 멀티모달 모델입니다.
파라미터
160.0B
컨텍스트
4K
라이선스
MIT
출시일
2026-01-14
API 가격
이 모델의 API 가격 정보는 현재 공개되지 않았습니다
강점
- ・대규모 160B 파라미터
- ・MIT 라이선스를 통한 개방성
- ・고급 시각 이해 능력
약점
- ・제한적인 4K 컨텍스트 길이
- ・대용량 35.8GB 파일 크기
- ・높은 연산 자원 요구사항
활용 사례
- ・고급 이미지 분석 및 이해
- ・시각 정보 추출 및 처리
- ・멀티모달 AI 개발
심층 분석
Architecture
Autoregressive (9B) + Diffusion (7B)
CVTG-2K Word Accuracy
0.9116
#1 open-source
LongText-Bench EN
0.9524
#1 open-source
LongText-Bench CN
0.9788
#1 open-source
Price
$0.015 per image
License
Apache 2.0
Release Date
January 9, 2026
강점
- ・Open-source SOTA text rendering (#1 CVTG-2K, LongText-Bench)
- ・Hybrid architecture combines semantics + detail
- ・Excels at knowledge-intensive generation
- ・Very affordable ($0.015/image)
약점
- ・General quality matches but doesn't surpass mainstream models
- ・Max 2048px resolution
- ・Smaller community (912 GitHub stars)
경쟁사 비교
| Model | Price |
|---|---|
| DALL-E 3 | $0.04-$0.08/image |
| Midjourney v6 | Subscription |
| Stable Diffusion 3 | Free (self-host) |
GLM-Image is a hybrid autoregressive+diffusion image generator. #1 open-source in text rendering accuracy. $0.015/image, Apache 2.0.
분석 생성일: 2026-05-24