모델 목록으로
バイドゥ오픈소스
ERNIE-4.5-VL-28B-A3B-Thinking Multimodal Reasoning Model
ERNIE-4.5-VL-28B-A3B-Thinking 멀티모달 추론 모델은 Baidu에서 개발한 멀티모달 추론 모델입니다. 약 280B의 파라미터 규모와 131K 컨텍스트 윈도우를 특징으로 하며, 고급 추론 능력을 제공합니다.
파라미터
280.0B
컨텍스트
131K
라이선스
Apache 2.0
출시일
2025-11-11
API 가격
이 모델의 API 가격 정보는 현재 공개되지 않았습니다
강점
- ・강력한 멀티모달 추론 능력
- ・대규모 280B 파라미터
- ・긴 131K 컨텍스트 지원
약점
- ・규모로 인한 높은 계산 자원 소비
- ・추론 특화로 인한 잠재적 속도 우려
- ・특정 작업을 위한 최적화 필요 가능
활용 사례
- ・복잡한 시각 정보의 논리적 분석
- ・긴 문서의 멀티모달 분석
- ・추론이 필요한 고급 시각 문제 해결
심층 분석
Architecture
MoE (28B total, 3B active)
Multimodal reasoning VLM
License
Apache 2.0
Open-source
Modalities
Text + Image
Vision-language model
Release Date
2025
Part of ERNIE 4.5 family
Framework
PaddlePaddle + Transformers
강점
- ・Apache 2.0 open-source license
- ・Lightweight 3B active parameters
- ・Multimodal reasoning with thinking capability
- ・Part of comprehensive ERNIE 4.5 family
- ・Available on HuggingFace and AI Studio
약점
- ・Small active parameter count limits complex tasks
- ・Chinese model ecosystem
- ・Limited benchmark data available
경쟁사 비교
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| ERNIE 4.5 (larger) | - | - | - | Higher |
| Qwen-VL | - | - | - | Comparable |
| InternVL2 | - | - | - | Comparable |
ERNIE-4.5-VL-28B-Thinking is Baidu's open-source multimodal reasoning model with 28B total and 3B active parameters. Part of the ERNIE 4.5 family, it combines vision and language understanding with thinking/reasoning capabilities under Apache 2.0 license.
분석 생성일: 2026-05-24