모델 목록으로
バイドゥ오픈소스

ERNIE-4.5-VL-28B-A3B-Thinking Multimodal Reasoning Model

ERNIE-4.5-VL-28B-A3B-Thinking 멀티모달 추론 모델은 Baidu에서 개발한 멀티모달 추론 모델입니다. 약 280B의 파라미터 규모와 131K 컨텍스트 윈도우를 특징으로 하며, 고급 추론 능력을 제공합니다.

파라미터

280.0B

컨텍스트

131K

라이선스

Apache 2.0

출시일

2025-11-11

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 강력한 멀티모달 추론 능력
  • 대규모 280B 파라미터
  • 긴 131K 컨텍스트 지원

약점

  • 규모로 인한 높은 계산 자원 소비
  • 추론 특화로 인한 잠재적 속도 우려
  • 특정 작업을 위한 최적화 필요 가능

활용 사례

  • 복잡한 시각 정보의 논리적 분석
  • 긴 문서의 멀티모달 분석
  • 추론이 필요한 고급 시각 문제 해결

심층 분석

Architecture

MoE (28B total, 3B active)

Multimodal reasoning VLM

License

Apache 2.0

Open-source

Modalities

Text + Image

Vision-language model

Release Date

2025

Part of ERNIE 4.5 family

Framework

PaddlePaddle + Transformers

강점

  • Apache 2.0 open-source license
  • Lightweight 3B active parameters
  • Multimodal reasoning with thinking capability
  • Part of comprehensive ERNIE 4.5 family
  • Available on HuggingFace and AI Studio

약점

  • Small active parameter count limits complex tasks
  • Chinese model ecosystem
  • Limited benchmark data available

경쟁사 비교

ModelArenaSWEGPQAPrice
ERNIE 4.5 (larger)---Higher
Qwen-VL---Comparable
InternVL2---Comparable

ERNIE-4.5-VL-28B-Thinking is Baidu's open-source multimodal reasoning model with 28B total and 3B active parameters. Part of the ERNIE 4.5 family, it combines vision and language understanding with thinking/reasoning capabilities under Apache 2.0 license.

분석 생성일: 2026-05-24