モデル一覧に戻る
DeepSeekプロプライエタリ
DeepSeek-OCR 2
DeepSeek-OCR 2は、DeepSeek-AIによって開発されたマルチモーダル大模型です。約3.5Bのパラメータ規模を持ち、32Kのコンテキスト長に対応した効率的なモデルとなっています。
パラメータ
3.5B
コンテキスト長
32K
ライセンス
https://github.com/deepseek-ai/deepseek-LLM/blob/main/LICENSE-MODEL
リリース日
2026-01-28
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・軽量な3.5Bパラメータ
- ・32Kの十分なコンテキスト長
- ・効率的なモデルサイズ
弱み
- ・クローズドなライセンス制限
- ・限定的なパラメータ規模
- ・汎用的な記述情報の不足
活用例
- ・高度なOCR処理
- ・画像内テキストの抽出
- ・マルチモーダル文書解析
深度分析
Parameters
3.5B
OmniDocBench v1.5
91.09%
Best end-to-end
Improvement
+3.73% over OCR 1
Vision Tokens
1120 max per page
License
Apache 2.0
Release Date
January 27, 2026
強み
- ・SOTA 91.09% OmniDocBench v1.5
- ・Novel Visual Causal Flow architecture
- ・+3.73% over OCR 1
- ・Lower repetition rates
弱み
- ・Specialized for OCR
- ・Newspaper recognition challenging
- ・Higher token budget than OCR 1 compressed modes
競合比較
| Model |
|---|
| DeepSeek-OCR |
| Gemini-3 Pro |
| Qwen3-VL-235B |
DeepSeek-OCR 2 achieves 91.09% on OmniDocBench v1.5 with novel Visual Causal Flow architecture. Best end-to-end OCR model.
出典
分析生成日: 2026-05-24