Gemma 4 E2B(有效2B端侧模型)
Gemma 4 E2Bは、DeepMindが開発したマルチモーダル基盤モデルです。約5.1Bのパラメータ規模を持ちながら、エッジデバイスでの効率的な動作を想定した設計となっています。
パラメータ
5.1B
コンテキスト長
128K
ライセンス
Apache 2.0
リリース日
2026-04
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・高いマルチモーダル対応力
- ・128Kの長いコンテキスト窓
- ・エッジデバイスでの効率的動作
弱み
- ・大規模モデル比での知識量
- ・複雑な推論の限界
- ・計算リソースへの依存度
活用例
- ・デバイス上のリアルタイム処理
- ・マルチモーダルデータの解析
- ・長文コンテキストの処理
深度分析
パラメータ
2.1B (effective) / 5.1B with embeddings
Gemma 4 ファミリーの最小モデル
コンテキストウィンドウ
128K tokens
Google/HuggingFaceのドキュメントによると(gemma4.devはテキスト専用モードで8Kと報告しています)
アーキテクチャ
Dense transformer
With Per-Layer Embeddings (PLE) and shared KV cache
最小VRAM (BF16)
5 GB
Or 2GB with Q4 quantization
マルチモーダル
Image + Audio input
Supports vision and audio unlike what some sources claim
リリース日
April 2, 2026
Part of Gemma 4 family launch
ライセンス
Apache 2.0
Apache 2.0ライセンスの最初のGemma
ツール使用
Yes
Supports function calling and structured output
言語
140+
Natively multilingual
強み
- ・CPUのみで完全に動作 - 基本的な推論にGPUは不要
- ・Q4量子化によりVRAMは2GBのみ必要
- ・マルチモーダル:小さなサイズでありながら画像・音声入力に対応
- ・エッジモデルとして128Kのコンテキストウィンドウは例外的
- ・Apache 2.0ライセンスで最大限の展開柔軟性を実現
- ・Ollama、llama.cpp、Transformers、MLX、WebGPUに対応
弱み
- ・思考モード非対応
- ・大規模モデルに比べて推論能力が限定的
- ・一部のソースではテキスト専用8Kコンテキスト版との報告あり(仕様が矛盾)
- ・複雑な多段階推論タスクには適していない
- ・極限の効率性のため品質とのトレードオフあり
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Gemma 4 E2B (2.1B) | N/A | N/A | N/A | Free (open weights) |
| Gemma 4 E4B (4.5B) | ~1300 (est) | N/A | ~50% (est) | Free (open weights) |
| Phi-3.5 Mini (3.8B) | ~1100 | N/A | ~55% | Free (open weights) |
| SmolLM2 (1.7B) | N/A | N/A | N/A | Free (open weights) |
| Qwen2.5 (3B) | ~1050 | N/A | ~45% | Free (open weights) |
モデル: gemma-4-e2b-2b フィールド: 要約
Gemma 4 E2Bは、Gemma 4ファミリーの最小モデルで、有効パラメータ数は2.1B(埋め込み層を含めると5.1B)です。Q4量子化時、わずか2GBのVRAMでCPUのみで完全に動作可能であり、マルチモーダル入力(画像+音声)に対応し、128Kのコンテキストウィンドウを備えています。2026年4月2日にApache 2.0ライセンスの下でリリースされました。
出典
分析生成日: 2026-05-30