Gemma 4 E4B(有效4B端侧高性能模型)
Gemma 4 E4Bは、DeepMindが開発したマルチモーダル基盤モデルです。8.0Bのパラメータ規模を持ちながら、デバイス上での効率的な動作を実現する高性能な設計となっています。
パラメータ
8.0B
コンテキスト長
128K
ライセンス
Apache 2.0
リリース日
2026-04
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・オンデバイスでの高い性能
- ・128Kの長いコンテキスト窓
- ・柔軟なApache 2.0ライセンス
弱み
- ・8.0Bの中規模なパラメータ数
- ・マルチモーダル対応の負荷
- ・特定用途への最適化の必要性
活用例
- ・エッジデバイスでのAI推論
- ・長文ドキュメントの解析
- ・マルチモーダル情報の処理
深度分析
有効パラメータ
4.5B
Per-Layer Embeddingsを含む合計8.0B
MMLU Pro
69.4%
Gemma 3 27Bと比較:67.6%
LiveCodeBench v6
52.0%
Gemma 3 27Bと比較:29.1%
GPQA Diamond
58.6%
Gemma 3 27Bと比較:42.4%
コンテキストウィンドウ
128Kトークン
ネイティブな長コンテキストサポート
生成速度
~70 t/s
RTX 4070 Ti、Q8_0、フルオフロード
VRAM (Q4)
~8 GB
コンシューマーGPUおよびApple Siliconで動作可能
ライセンス
Apache 2.0
完全オープン、商用利用可能
強み
- ・エッジティアモデルにもかかわらず、推論、コーディング、科学ベンチマークでGemma 3 27B(その6倍のサイズ)を凌駕
- ・テキストやビジョンに加え、ネイティブな音声入力をサポート — Gemma 4変種の中で唯一であり、オンデバイスでの音声/ASRユースケースを可能にする
- ・極めて高効率:ミッドレンジのRTX 4070 Tiで約70 t/sの生成速度、128Kコンテキストまで穏やかな性能低下
弱み
- ・E2Bのような思考/連鎖思考(CoT)モードをサポートしていない — 複雑な多段階推論タスクには不向き
- ・ハードな数学やコーディングベンチマークでは、より大きなGem 4兄弟モデル(31B: 89.2% AIME vs E4B: 42.5%)に大きく後れをとる
- ・Ollamaとの統合時の癖:E4Bは思考モードを完全に欠き、E2Bがデフォルトで備えているため、ファミリー全体で開発者体験に一貫性がない
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Gemma 4 E2B | N/A | N/A | 43.4% | 無料(セルフホスト) |
| Gemma 4 26B A4B | 1441 | N/A | 82.3% | 無料(セルフホスト) |
| Gemma 4 31B | 1452 | N/A | 84.3% | 無料(セルフホスト) |
| Gemma 3 27B | 1365 | N/A | 42.4% | 無料(セルフホスト) |
Gemma 4 E4Bは、Google DeepMindによるGemma 4ファミリーの高性能エッジモデルで、2026年4月2日にリリースされました。有効パラメータは4.5B(Per-Layer Embeddingsを含む合計8.0B)に過ぎませんが、その規模を遥かに超える性能を発揮し、前世代のGemma 3 27Bと比較して推論(GPQA Diamond: 58.6% vs 42.4%)、コーディング(LiveCodeBench: 52.0% vs 29.1%)、数学(AIME: 42.5% vs 20.8%)の各ベンチマークで優れた結果を示しています。これは、前モデルの6分の1のサイズで優れた結果をもたらす世代飛躍であり、効率的なAIアーキテクチャにおける画期的な成果です。
このモデルは、ラップトップ、スマートフォン、IoTデバイスなど、コンシューマーハードウェアでのデプロイを目的として設計されています。フルGPUオフロード状態のRTX 4070 Tiでは、約70トークン/秒の生成速度を達成し、最大128Kのコンテキスト長にわたって安定した性能を示します。Q4量子化バージョンは約8GBのVRAMしか必要とせず、Apple Siliconの統合メモリ上でも快適に動作します。Gemma 4ファミリー内で唯一、E4Bは(テキストやビジョンに加え)ネイティブな音声入力をサポートしており、より大きな26Bや31Bの変種にはない、オンデバイスでの音声理解を可能にする機能を提供します。
エッジおよびローカルデプロイ向けの推奨スタート地点として位置づけられ、E4Bは摩擦のない商用採用のためにApache 2.0ライセンスを採用しています。E2Bで利用可能な思考/CoTモードは欠けていますが、ベンチマークは構造化されたタスク(抽出、翻訳、コミットメッセージ)においてより優れた出力品質と高速な実効スループットを提供することを示しています。Gemma 4ファミリー内で開発者向けに、Googleとコミュニティのコンセンサスは明確です:エッジ/モバイルユースケースにはまずE4Bを試し、ワークステーショングレードの推論には26B A4Bへ、最高品質が絶対条件の場合のみ31Bを検討してください。
出典
分析生成日: 2026-05-23