モデル一覧に戻る
Zhipu AIオープンソース

GLM-OCR

GLM-OCRは、智谱AIが開発した視覚大模型です。約90億パラメータの規模を持ち、Apache 2.0ライセンスで公開されているオープンなマルチモーダルモデルです。

パラメータ

9.0B

コンテキスト長

8K

ライセンス

Apache 2.0

リリース日

2026-02-03

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 視覚認識に特化した設計
  • 90億規模の十分なパラメータ
  • オープンライセンスで利用可能

弱み

  • コンテキスト長が8Kと限定的
  • 特化型のため汎用性は未知数
  • メモリ消費が一定数必要

活用例

  • 高度な画像内文字認識
  • 視覚情報のデジタルデータ化
  • ドキュメント解析の自動化

深度分析

入力価格

$0.20/1M

低コスト

出力価格

$0.80/1M

低コスト

コンテキスト

32Kトークン

OCR向け

強み

  • Zhipu AIのOCR特化モデル
  • テキスト認識で高性能
  • コスト効率が良い
  • 中国語テキスト認識に優秀

弱み

  • OCR特化のため汎用性が低い
  • API利用が限定的
  • ドキュメントが限定的

競合比較

ModelPrice
PaddleOCR-VL-1.5N/A
MinerU2.5N/A
DeepSeek-OCRN/A

GLM-OCRは0.9Bパラメータのモデルで、OmniDocBench v1.5(94.62)においてSOTAを達成し、235Bモデルを上回っています。~$0.03/1Mトークン、8言語対応。

出典

分析生成日: 2026-05-24