モデル一覧に戻る
Sakana AI条件付オープン

Llama-3-Namazu-405B

Sakana AIが開発した大規模パラメータ版のNamazuモデル。Llama-3-405Bをベースに、日本の文化的・社会的文脈に最適化した事後学習を施している。

パラメータ

405B

コンテキスト長

128K

ライセンス

Llama 3 License

リリース日

2026-03-15

日本語性能

🇯🇵ネイティブJP

日本企業が開発したモデルまたは日本語に特化したモデル。日本語の理解・生成能力が最も高い。

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 405Bパラメータで高性能
  • 日本の文化的文脈に最適化
  • Llama 3の強力なベースモデル
  • 長文生成品質が高い

弱み

  • 動作に高スペックなGPUが必要
  • 非商用ライセンス(Llama 3 License)
  • 推論コストが高い
  • API提供がない

活用例

  • 高品質な日本語コンテンツ生成
  • 複雑な日本語推論タスク
  • 研究・開発用途
  • 大規模データの日本語処理

深度分析

MMLU (5-shot)

88.6%

GPT-4o(〜88.7%)とほぼ同等の水準

HumanEval(コーディング)

89.0%

競争力あり、Claude 3.5 Sonnet(92.0%)には及ばない

入力価格

$2.40/M tokens

Amazon Standardプロバイダー経由

出力価格

$2.40/M tokens

Amazon Standardプロバイダー経由

コンテキストウィンドウ

128K tokens

Llama 3.1のアップグレード、以前は8Kから拡大

基盤モデルの焦点

Japanese Cultural Context

中立性と事実の正確性のための事後訓練

強み

  • 主要ベンチマークにおいて、クローズドソースモデルに匹敵するフロンティアレベルの性能。
  • 事後訓練により、政治的/文化的バイアスと、日本固有のコンテキストに対する問い合わせでの拒否率を低減。
  • データ主権のため、セルフホスティングと微調整が可能な広範なオープンウェイトモデル。
  • GPT-4oと比較して大幅な割引で、複数プロバイダーからコスト効率の高いAPIアクセスが可能。

弱み

  • セルフホスティングには膨大な計算リソースが必要(INT4で200GB以上のVRAM、マルチGPUセットアップが必要)。
  • テキストのみの入力(ネイティブのビジョンまたはオーディオ機能なし)、GPT-4oのようなマルチモーダルモデルとは異なる。
  • 事前訓練データの知識カットオフ(2023年12月)のため、RAGなしでは現在の出来事に遅れが生じる可能性あり。
  • Namazuバリアントの特化型最適化は、対象コンテキスト外での汎用的な適用性が低下している可能性がある。

競合比較

ModelArenaSWEGPQAPrice
Meta Llama 3.1 405B (Base)N/AN/A51.1%$2.40/$2.40
GPT-4oN/AN/A53.6%$2.50/$10.00
Claude 3.5 SonnetN/AN/A59.4%$3.00/$15.00

Llama-3-Namazu-405Bは、Sakana AIがMetaのLlama 3.1 405Bアーキテクチャを基に開発した、特化型の大規模パラメータバリアントです。これは、モデルを日本文化および社会的コンテキストに最適化することを目的とした、焦点を絞った事後訓練の成果を表しています。主な革新は、生のベンチマークの優位性(基本能力は強力な基盤モデルに由来)ではなく、主に西洋中心のデータで訓練されたモデルに一般的に見られる、固有のバイアスを是正し、政治的に敏感なトピックに対する拒否率を低減するためのファインチューニングにあります。Sakanaの内部ベンチマークで示されているように、Namazuは、敏感な歴史的・政治的テーマに関する問い合わせに対する拒否率を大幅に削減しました(DeepSeekベースのバリアントでは〜72%からほぼ0%へ)。

このモデルは、文化固有のトピックについて自動的な自己検閲なしにバランスの取れた、多角的な視点からの応答を必要とする日本の開発者や組織向けのソリューションとして、オープンウェイトエコシステム内に位置づけられています。基盤の405Bモデルが持つフロンティアレベルの性能(一般知識や数学ベンチマークでGPT-4oと競争力あり)を継承しつつ、オープンウェイトの典型的な利点(データプライバシーのためのセルフホスティング、ドメイン固有の微調整の可能性、大規模展開でのコスト効率)を提供します。ただし、その計算需要が大きいため、実用的な導入はリソースが十分な組織またはAPIプロバイダーを介したものに限定されます。

分析生成日: 2026-05-23