모델 목록으로
DeepSeek오픈소스

DeepSeek-OCR

DeepSeek-OCR는 DeepSeek-AI가 개발한 시각 대형 모델입니다. 약 30.0B 파라미터 스케일을 가지며, MIT 라이선스로 출시되었습니다.

파라미터

30.0B

컨텍스트

라이선스

MIT

출시일

2025-10-20

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 300억 파라미터 스케일
  • 개방된 라이선스 하에서 이용 가능
  • 고급 시각 정보 처리

약점

  • 특정 작업을 위한 전문화
  • 운영을 위한 연산 자원 요구
  • 범용 대화 능력 부족

활용 사례

  • 이미지에서의 광학 문자 인식
  • 시각 데이터 분석
  • 문서 디지털화

심층 분석

OCR Precision

97% at <10x compression

Vision Tokens

64-1853 per page

Production Speed

200k+ pages/day (single A100)

Languages

~100

License

Apache 2.0

Release Date

October 20, 2025

강점

  • Revolutionary compression (97% at 10x)
  • 200k+ pages/day on single GPU
  • ~100 language support
  • Deep parsing (charts, formulas)

약점

  • Not a general VLM
  • Degrades at 20x compression
  • No SFT stage (not a chatbot)

경쟁사 비교

Model
GOT-OCR2.0
MinerU2.0

DeepSeek-OCR pioneers optical compression: 97% precision at 10x compression. 200k+ pages/day on single A100, ~100 languages.

출처

분석 생성일: 2026-05-24