モデル一覧に戻る
DeepSeekオープンソース

DeepSeek-OCR

DeepSeek-OCRは、DeepSeek-AIによって開発された視覚大模型です。約30.0Bのパラメータ規模を持ち、MITライセンスの下で公開されています。

パラメータ

30.0B

コンテキスト長

ライセンス

MIT

リリース日

2025-10-20

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 300億パラメータの規模
  • オープンライセンスでの提供
  • 視覚情報の高度な処理能力

弱み

  • 特定タスクへの特化
  • 運用時の計算リソースが必要
  • 汎用的な対話能力の不足

活用例

  • 画像からの文字認識
  • 視覚データの分析
  • ドキュメントのデジタル化

深度分析

OCR Precision

97% at <10x compression

Vision Tokens

64-1853 per page

Production Speed

200k+ pages/day (single A100)

言語

~100

License

Apache 2.0

Release Date

October 20, 2025

強み

  • Revolutionary compression (97% at 10x)
  • 200k+ pages/day on single GPU
  • ~100 language support
  • Deep parsing (charts, formulas)

弱み

  • Not a general VLM
  • Degrades at 20x compression
  • No SFT stage (not a chatbot)

競合比較

Model
GOT-OCR2.0
MinerU2.0

DeepSeek-OCR pioneers optical compression: 97% precision at 10x compression. 200k+ pages/day on single A100, ~100 languages.

出典

分析生成日: 2026-05-24