モデル一覧に戻る
バイドゥオープンソース
ERNIE-4.5-VL-28B-A3B-Thinking Multimodal Reasoning Model
ERNIE-4.5-VL-28B-A3B-Thinking Multimodal Reasoning Modelは、百度が開発したマルチモーダル推論モデルです。約280Bのパラメータ規模と131Kのコンテキストウィンドウを備え、高度な推論能力を提供します。
パラメータ
280.0B
コンテキスト長
131K
ライセンス
Apache 2.0
リリース日
2025-11-11
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・強力なマルチモーダル推論能力
- ・280Bの大規模なパラメータ数
- ・131Kの長いコンテキスト対応
弱み
- ・モデルサイズによる計算リソース消費
- ・推論特化型ゆえの応答速度の懸念
- ・特定タスクへの最適化の必要性
活用例
- ・複雑な視覚情報の論理的分析
- ・長文ドキュメントのマルチモーダル解析
- ・高度な推論を要する視覚的問題解決
深度分析
アーキテクチャ
MoE (28B total, 3B active)
Multimodal reasoning VLM
ライセンス
Apache 2.0
Open-source
モダリティ
Text + Image
Vision-language model
リリース日
2025
Part of ERNIE 4.5 family
フレームワーク
PaddlePaddle + Transformers
強み
- ・Apache 2.0オープンソースライセンス
- ・軽量3Bアクティブパラメータ
- ・思考能力を備えたマルチモーダル推論
- ・包括的なERNIE 4.5ファミリーの一部
- ・HuggingFaceとAI Studioで利用可能
弱み
- ・アクティブパラメータ数の少なさが複雑なタスクを制限
- ・中国のモデルエコシステム
- ・限られたベンチマークデータ
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| ERNIE 4.5 (larger) | - | - | - | Higher |
| Qwen-VL | - | - | - | Comparable |
| InternVL2 | - | - | - | Comparable |
ERNIE-4.5-VL-28B-Thinkingは、Baiduのオープンソース・マルチモーダル推論モデルで、総パラメータ数28B、アクティブパラメータ3Bを有します。ERNIE 4.5ファミリーの一員として、視覚と言語の理解に思考・推論能力を組み合わせ、Apache 2.0ライセンスの下で提供されています。
分析生成日: 2026-05-30