모델 목록으로
Zhipu AI오픈소스

GLM-OCR

GLM-OCR는 Zhipu AI가 개발한 비전 대규모 모델입니다. 약 90억 개의 파라미터를 가지며, Apache 2.0 라이선스로 공개된 오픈 멀티모달 모델입니다.

파라미터

9.0B

컨텍스트

8K

라이선스

Apache 2.0

출시일

2026-02-03

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 시각 인식 특화 설계
  • 충분한 90억 파라미터 규모
  • 오픈 라이선스로 이용 가능

약점

  • 제한된 8K 컨텍스트 길이
  • 전문성으로 인한 다용도성 불명
  • 일정한 메모리 소비 필요

활용 사례

  • 고급 이미지 내 텍스트 인식
  • 시각 정보 디지털화
  • 문서 분석 자동화

심층 분석

Parameters

0.9B (900M)

OmniDocBench v1.5

94.62

#1 overall

OCRBench

94.0

Throughput

1.86 pages/sec (PDF)

Pricing

~$0.03/1M tokens

Languages

8 languages

Release Date

March 2025

강점

  • SOTA OmniDocBench v1.5 (94.62) with only 0.9B params
  • 1/10 cost of traditional OCR
  • Multi-Token Prediction ~50% throughput boost
  • 8 languages, edge-deployable

약점

  • Very specialized
  • No video/interactive tasks
  • KIE trails Gemini-3-Pro

경쟁사 비교

ModelPrice
PaddleOCR-VL-1.5N/A
MinerU2.5N/A
DeepSeek-OCRN/A

GLM-OCR is a 0.9B model achieving SOTA on OmniDocBench v1.5 (94.62), surpassing 235B models. ~$0.03/1M tokens, 8 languages.

출처

분석 생성일: 2026-05-24