モデル一覧に戻る
DeepMindオープンソース

Gemma 4 E2B(有效2B端侧模型)

Gemma 4 E2Bは、DeepMindが開発したマルチモーダル基盤モデルです。約5.1Bのパラメータ規模を持ちながら、エッジデバイスでの効率的な動作を想定した設計となっています。

パラメータ

5.1B

コンテキスト長

128K

ライセンス

Apache 2.0

リリース日

2026-04

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 高いマルチモーダル対応力
  • 128Kの長いコンテキスト窓
  • エッジデバイスでの効率的動作

弱み

  • 大規模モデル比での知識量
  • 複雑な推論の限界
  • 計算リソースへの依存度

活用例

  • デバイス上のリアルタイム処理
  • マルチモーダルデータの解析
  • 長文コンテキストの処理

深度分析

パラメータ

2.1B (effective) / 5.1B with embeddings

Gemma 4 ファミリーの最小モデル

コンテキストウィンドウ

128K tokens

Google/HuggingFaceのドキュメントによると(gemma4.devはテキスト専用モードで8Kと報告しています)

アーキテクチャ

Dense transformer

With Per-Layer Embeddings (PLE) and shared KV cache

最小VRAM (BF16)

5 GB

Or 2GB with Q4 quantization

マルチモーダル

Image + Audio input

Supports vision and audio unlike what some sources claim

リリース日

April 2, 2026

Part of Gemma 4 family launch

ライセンス

Apache 2.0

Apache 2.0ライセンスの最初のGemma

ツール使用

Yes

Supports function calling and structured output

言語

140+

Natively multilingual

強み

  • CPUのみで完全に動作 - 基本的な推論にGPUは不要
  • Q4量子化によりVRAMは2GBのみ必要
  • マルチモーダル:小さなサイズでありながら画像・音声入力に対応
  • エッジモデルとして128Kのコンテキストウィンドウは例外的
  • Apache 2.0ライセンスで最大限の展開柔軟性を実現
  • Ollama、llama.cpp、Transformers、MLX、WebGPUに対応

弱み

  • 思考モード非対応
  • 大規模モデルに比べて推論能力が限定的
  • 一部のソースではテキスト専用8Kコンテキスト版との報告あり(仕様が矛盾)
  • 複雑な多段階推論タスクには適していない
  • 極限の効率性のため品質とのトレードオフあり

競合比較

ModelArenaSWEGPQAPrice
Gemma 4 E2B (2.1B)N/AN/AN/AFree (open weights)
Gemma 4 E4B (4.5B)~1300 (est)N/A~50% (est)Free (open weights)
Phi-3.5 Mini (3.8B)~1100N/A~55%Free (open weights)
SmolLM2 (1.7B)N/AN/AN/AFree (open weights)
Qwen2.5 (3B)~1050N/A~45%Free (open weights)

モデル: gemma-4-e2b-2b フィールド: 要約

Gemma 4 E2Bは、Gemma 4ファミリーの最小モデルで、有効パラメータ数は2.1B(埋め込み層を含めると5.1B)です。Q4量子化時、わずか2GBのVRAMでCPUのみで完全に動作可能であり、マルチモーダル入力(画像+音声)に対応し、128Kのコンテキストウィンドウを備えています。2026年4月2日にApache 2.0ライセンスの下でリリースされました。

分析生成日: 2026-05-30