모델 목록으로
Zhipu AI오픈소스
GLM-OCR
GLM-OCR는 Zhipu AI가 개발한 비전 대규모 모델입니다. 약 90억 개의 파라미터를 가지며, Apache 2.0 라이선스로 공개된 오픈 멀티모달 모델입니다.
파라미터
9.0B
컨텍스트
8K
라이선스
Apache 2.0
출시일
2026-02-03
API 가격
이 모델의 API 가격 정보는 현재 공개되지 않았습니다
강점
- ・시각 인식 특화 설계
- ・충분한 90억 파라미터 규모
- ・오픈 라이선스로 이용 가능
약점
- ・제한된 8K 컨텍스트 길이
- ・전문성으로 인한 다용도성 불명
- ・일정한 메모리 소비 필요
활용 사례
- ・고급 이미지 내 텍스트 인식
- ・시각 정보 디지털화
- ・문서 분석 자동화
심층 분석
Parameters
0.9B (900M)
OmniDocBench v1.5
94.62
#1 overall
OCRBench
94.0
Throughput
1.86 pages/sec (PDF)
Pricing
~$0.03/1M tokens
Languages
8 languages
Release Date
March 2025
강점
- ・SOTA OmniDocBench v1.5 (94.62) with only 0.9B params
- ・1/10 cost of traditional OCR
- ・Multi-Token Prediction ~50% throughput boost
- ・8 languages, edge-deployable
약점
- ・Very specialized
- ・No video/interactive tasks
- ・KIE trails Gemini-3-Pro
경쟁사 비교
| Model | Price |
|---|---|
| PaddleOCR-VL-1.5 | N/A |
| MinerU2.5 | N/A |
| DeepSeek-OCR | N/A |
GLM-OCR is a 0.9B model achieving SOTA on OmniDocBench v1.5 (94.62), surpassing 235B models. ~$0.03/1M tokens, 8 languages.
출처
분석 생성일: 2026-05-24