モデル一覧に戻る
バイドゥオープンソース

ERNIE-4.5-VL-28B-A3B-Thinking Multimodal Reasoning Model

ERNIE-4.5-VL-28B-A3B-Thinking Multimodal Reasoning Modelは、百度が開発したマルチモーダル推論モデルです。約280Bのパラメータ規模と131Kのコンテキストウィンドウを備え、高度な推論能力を提供します。

パラメータ

280.0B

コンテキスト長

131K

ライセンス

Apache 2.0

リリース日

2025-11-11

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 強力なマルチモーダル推論能力
  • 280Bの大規模なパラメータ数
  • 131Kの長いコンテキスト対応

弱み

  • モデルサイズによる計算リソース消費
  • 推論特化型ゆえの応答速度の懸念
  • 特定タスクへの最適化の必要性

活用例

  • 複雑な視覚情報の論理的分析
  • 長文ドキュメントのマルチモーダル解析
  • 高度な推論を要する視覚的問題解決

深度分析

アーキテクチャ

MoE (28B total, 3B active)

Multimodal reasoning VLM

ライセンス

Apache 2.0

Open-source

モダリティ

Text + Image

Vision-language model

リリース日

2025

Part of ERNIE 4.5 family

フレームワーク

PaddlePaddle + Transformers

強み

  • Apache 2.0オープンソースライセンス
  • 軽量3Bアクティブパラメータ
  • 思考能力を備えたマルチモーダル推論
  • 包括的なERNIE 4.5ファミリーの一部
  • HuggingFaceとAI Studioで利用可能

弱み

  • アクティブパラメータ数の少なさが複雑なタスクを制限
  • 中国のモデルエコシステム
  • 限られたベンチマークデータ

競合比較

ModelArenaSWEGPQAPrice
ERNIE 4.5 (larger)---Higher
Qwen-VL---Comparable
InternVL2---Comparable

ERNIE-4.5-VL-28B-Thinkingは、Baiduのオープンソース・マルチモーダル推論モデルで、総パラメータ数28B、アクティブパラメータ3Bを有します。ERNIE 4.5ファミリーの一員として、視覚と言語の理解に思考・推論能力を組み合わせ、Apache 2.0ライセンスの下で提供されています。

分析生成日: 2026-05-30