このモデルの強みは何ですか？

高いマルチモーダル対応力 128Kの長いコンテキスト窓エッジデバイスでの効率的動作

このモデルの弱みは何ですか？

大規模モデル比での知識量複雑な推論の限界計算リソースへの依存度

どんな用途に最適ですか？

デバイス上のリアルタイム処理マルチモーダルデータの解析長文コンテキストの処理

モデル一覧に戻る

DeepMindオープンソース

Gemma 4 E2B（有效2B端侧模型）

Name: Gemma 4 E2B（有效2B端侧模型）
Author: DeepMind

Gemma 4 E2Bは、DeepMindが開発したマルチモーダル基盤モデルです。約5.1Bのパラメータ規模を持ちながら、エッジデバイスでの効率的な動作を想定した設計となっています。

パラメータ

5.1B

コンテキスト長

128K

ライセンス

Apache 2.0

リリース日

2026-04

API料金

このモデルのAPI料金情報は現在未公開です

強み

・高いマルチモーダル対応力
・128Kの長いコンテキスト窓
・エッジデバイスでの効率的動作

弱み

・大規模モデル比での知識量
・複雑な推論の限界
・計算リソースへの依存度

活用例

・デバイス上のリアルタイム処理
・マルチモーダルデータの解析
・長文コンテキストの処理

深度分析

パラメータ

2.1B (effective) / 5.1B with embeddings

Gemma 4 ファミリーの最小モデル

コンテキストウィンドウ

128K tokens

Google/HuggingFaceのドキュメントによると（gemma4.devはテキスト専用モードで8Kと報告しています）

アーキテクチャ

Dense transformer

With Per-Layer Embeddings (PLE) and shared KV cache

最小VRAM (BF16)

5 GB

Or 2GB with Q4 quantization

マルチモーダル

Image + Audio input

Supports vision and audio unlike what some sources claim

リリース日

April 2, 2026

Part of Gemma 4 family launch

ライセンス

Apache 2.0

Apache 2.0ライセンスの最初のGemma

ツール使用

Yes

Supports function calling and structured output

言語

140+

Natively multilingual

強み

・CPUのみで完全に動作 - 基本的な推論にGPUは不要
・Q4量子化によりVRAMは2GBのみ必要
・マルチモーダル：小さなサイズでありながら画像・音声入力に対応
・エッジモデルとして128Kのコンテキストウィンドウは例外的
・Apache 2.0ライセンスで最大限の展開柔軟性を実現
・Ollama、llama.cpp、Transformers、MLX、WebGPUに対応

弱み

・思考モード非対応
・大規模モデルに比べて推論能力が限定的
・一部のソースではテキスト専用8Kコンテキスト版との報告あり（仕様が矛盾）
・複雑な多段階推論タスクには適していない
・極限の効率性のため品質とのトレードオフあり

競合比較

Model	Arena	SWE	GPQA	Price
Gemma 4 E2B (2.1B)	N/A	N/A	N/A	Free (open weights)
Gemma 4 E4B (4.5B)	~1300 (est)	N/A	~50% (est)	Free (open weights)
Phi-3.5 Mini (3.8B)	~1100	N/A	~55%	Free (open weights)
SmolLM2 (1.7B)	N/A	N/A	N/A	Free (open weights)
Qwen2.5 (3B)	~1050	N/A	~45%	Free (open weights)

概要

モデル: gemma-4-e2b-2b フィールド: 要約 Gemma 4 E2Bは、Gemma 4ファミリーの最小モデルで、有効パラメータ数は2.1B（埋め込み層を含めると5.1B）です。Q4量子化時、わずか2GBのVRAMでCPUのみで完全に動作可能であり、マルチモーダル入力（画像＋音声）に対応し、128Kのコンテキストウィンドウを備えています。2026年4月2日にApache 2.0ライセンスの下でリリースされました。

ベンチマーク＆性能

モデル: gemma-4-e2b-2b フィールド: パフォーマンスサイズのため標準的なリーダーボードではベンチマークされていません。レイテンシとハードウェアコストがピーク品質よりも重要となるエッジデプロイメント向けに設計されています。極めて小さなフットプリントでありながら、ツール使用、関数呼び出し、構造化出力をサポートしています。

詳細比較

Phi-3.5 Mini (3.8B)やQwen2.5 (3B)と同等またはそれ以下のサイズでありながら、Gemma 4のアーキテクチャの進歩（PLE、共有KVキャッシュ）により著しく高い性能を発揮します。このサイズクラスでのマルチモーダル対応はユニークです。

コミュニティ評価

Raspberry Pi、IoT、モバイル開発者に人気。CPUのみでの推論能力が評価されている。2Bパラメータでの128Kコンテキストは画期的と見なされている。組み込みおよびモバイルアプリケーションを構築する活発なコミュニティ。

ユースケース

Raspberry Piプロジェクト、CI/CDテキスト処理、モバイルアプリ推論、組み込みシステム、および超低遅延アプリケーションに最適です。クラウド接続が利用できない環境でのオフライン/オンデバイスAIに最適です。コミットメッセージ生成、PR要約、および簡易なテキストタスクに適しています。