Namazu-DeepSeek-V3.1-Terminus
Sakana AIが開発した日本特化型オープンLLM。DeepSeek-V3.1-Terminusをベースに、日本の文化的・社会的文脈に合うよう事後学習でバイアスを是正したモデル。政治・歴史・外交テーマにおける中立性と正確性の大幅改善が特徴。
パラメータ
685B (MoE)
コンテキスト長
128K
ライセンス
Apache 2.0
リリース日
2026-03-15
日本語性能
日本企業が開発したモデルまたは日本語に特化したモデル。日本語の理解・生成能力が最も高い。
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・日本の文化的文脈に最適化
- ・回答拒否率を72%からほぼ0%に改善
- ・オープンソース(Apache 2.0)
- ・ベースモデルと同等の推論性能を維持
弱み
- ・ベースモデルに依存(独自学習は事後学習のみ)
- ・API提供が限定的
- ・グローバルベンチマークでの評価が少ない
- ・まだアルファ版
活用例
- ・日本語チャットボット
- ・政治・歴史テーマの質問応答
- ・日本の文化・社会に関するコンテンツ生成
- ・教育・研究用途
深度分析
ベースモデル
DeepSeek-V3.1-Terminus
671B params, 37B active
コンテキストウィンドウ
163,840 tokens
Extended from base 128K
入力価格
$0.27/1M tokens
via DeepInfra
出力価格
$0.95/1M tokens
via DeepInfra
専門化
Japanese Cultural & Social Contexts
Corrected biases for Japan
ライセンス
MIT
Open-source, commercially permissive
強み
- ・日本の文脈に特化した追加学習により、文化的・歴史的なバイアスを修正
- ・オープンソースのMITライセンスにより、商用利用と自己ホスティングが可能
- ・同等の欧米フロンティアモデルと比較して大幅に低コスト
- ・DeepSeek-V3.1-Terminusベースの強力なコーディング能力とエージェント能力を維持
- ・一部のプロバイダーで163Kの拡張コンテキストウィンドウに対応
弱み
- ・グローバルなベンチマークデータが限定的であるか、存在しない;日本語以外のコンテキストでの性能は未検証
- ・DeepSeek V3.1-Terminusベースに依存しており、より新しいDeepSeek V4モデルに対して遅れを取っている
- ・地域特化により、日本語以外のユースケースでの多言語汎用性が制限される可能性がある
- ・専門分野における残存バイアスや不正確さの可能性
- ・コミュニティおよびエコシステムが主要なモデルファミリーに比べてはるかに小さい
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| DeepSeek-V3.1-Terminus (Original) | N/A | 68.4% | 80.7% | $0.27/$0.95 (per 1M tokens) |
| DeepSeek-V4 Pro | N/A | ~68.5% (Verified) | Higher than V3.1-T | $0.30/$0.50 (per 1M tokens) |
| Sakana's Japanese-optimized LLM (Hypothetical) | N/A | N/A | N/A | Not publicly listed |
Namazu-DeepSeek-V3.1-Terminusは、Sakana AIが開発した、日本の言語的・文化的文脈に特化したオープンソースの大規模言語モデルです。DeepSeek-V3.1-Terminusのアーキテクチャ(総パラメータ数671B、トークンあたり37Bアクティブ)をベースに、日本に関連する政治、歴史、外交などの敏感な領域における内在するバイアスの修正と中立性の向上を目的とした、標的なポストトレーニングを受けています。このモデルは、日本のユーザーとアプリケーションに対してより正確で文脈に適切な応答を提供し、汎用モデルが不足しがちな重要な隙間を埋めることを目指しています。
このモデルは、DeepSeek-V3.1-Terminusの強固な技術的基盤を継承しており、ハイブリッド推論能力(思考モード/非思考モード)、構造化ツール呼び出しのサポート、およびSWE-Benchなどのコーディングおよびエージェント系ベンチマークでの競争力のあるパフォーマンスを備えています。しかしながら、その主な価値提案は、生のベンチマークでの優位性ではなく、専門的なアライメントにあります。日本の社会的規範を深く理解し、欧米中心のバイアスを回避するAIを必要とする開発者や組織にとって、ニッチでありながら不可欠なツールとして位置づけられています。
運用面から見ると、NamazuはDeepInfraなどのインフラストラクチャパートナーを通じてAPIとして展開され、非常に競争力のある価格帯で提供されており、ほとんどの西洋のフロンティアモデルを桁違いに下回っています。オープンソースのMITライセンスは、ローカル展開とカスタマイズのためのアクセシビリティをさらに高めています。日本中心のAIにとって大きな前進を示す一方で、グローバルベンチマークでのパフォーマンスは未公表であり、市場の高度に専門化されたセグメントで運用されています。
出典
分析生成日: 2026-05-30