PLaMo 2.0
Preferred Networks(PFN)が開発した国産大規模言語モデルの最新版。310億パラメータで、日本語タスクにおいてGPT-4 miniやClaude 2.5に匹敵する性能を実現。さくらインターネット・NICTとの共同プロジェクトにより、NICTが蓄積した700億ページ超の日本語Webデータを学習に活用。
パラメータ
31B
コンテキスト長
32K
ライセンス
PLaMo License
リリース日
2026-03-01
日本語性能
日本企業が開発したモデルまたは日本語に特化したモデル。日本語の理解・生成能力が最も高い。
API料金
入力料金(1Mトークンあたり)
¥50
出力料金(1Mトークンあたり)
¥200
課金モード: standard
強み
- ・日本語処理能力が極めて高い
- ・国産モデルで日本の文脈に最適化
- ・700億ページ超の日本語データで学習
- ・さくらインターネット経由でAPI利用可能
弱み
- ・グローバルベンチマークではフロンティアモデルに劣る
- ・コンテキスト長が32Kと短め
- ・非商用ライセンス(商用は要相談)
- ・推論速度がやや遅い
活用例
- ・日本語ドキュメントの生成・要約
- ・カスタマーサポート(日本語)
- ・日本の法規制に対応したAIシステム
- ・国内クラウドでのAI運用
深度分析
Jaster Benchmark (4-shot, acc)
0.665
31Bクラスモデル中で最高スコアを記録し、gpt-4o-mini(0.635)を上回ります
pfgen-bench (Japanese fluency)
0.890
31Bモデルにおけるトップスコアで、gpt-4o-mini(0.804)を凌駕しています
M-IFEval Japanese (avg)
0.677
31Bモデルの中で日本語の指示遵守能力が最も優れています
Input Price
¥60/M tokens
約$0.40/Mトークンで、PLaMo 1.0 Primeと比較して75%安価です
Context Length
32,000 tokens
前バージョンから2倍に拡大し、長文書処理が可能になりました
Token Efficiency (Japanese)
+45% improvement
カスタムトークナイザーにより、標準トークナイザーと比較して文字あたりのコストが削減されます
強み
- ・日本語の流暢さと文化的ニュアンスの理解に優れ、日本語特化のベンチマークでトップスコアを達成しています。
- ・モデルプルーニングによる高い学習効率を実現し、8Bモデルが前世代の100Bモデルと同等の性能を発揮します。
- ・最適化されたトークナイザーと量子化サポートによりコスト効率の高いデプロイが可能で、API価格を大幅に削減しています。
弱み
- ・複雑な多段階の数学的推論において、専門的な推論モデルと比較するとやや劣ります。
- ・コード生成性能は向上しているものの、コーディングベンチマークではQwen3-8B-Baseなどのモデルに後れを取っています。
- ・長コンテキストの検索能力を実現するためにアーキテクチャの修正(フルアテンションへの移行)が必要で、当初のハイブリッドSamba設計の限界を示しています。
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| PLaMo 2.0-31B | N/A | N/A | N/A | ¥60/¥250 per M tokens |
| Qwen2.5-32B-Instruct | N/A | N/A | N/A | オープンソース |
| gpt-4o-mini | N/A | N/A | N/A | $0.15/$0.60 per M tokens |
PLaMo 2.0は、Preferred Networksによる日本語特化型大規模言語モデルの大きな進歩を示しています。このシリーズは、計算効率を高めるために、最初にMambaの状態空間モデルとスライディングウィンドウアテンション(Samba)を組み合わせたハイブリッドアーキテクチャを採用し、その後、長期コンテキストの検索制限を克服するためにフルアテンションへの移行による継続事前学習を行います。このアプローチに、大規模な合成データ生成や効率的なモデルプルーニングといった革新的な訓練手法を組み合わせることで、310億パラメータモデルが1000億パラメータの前世代モデルと同等の性能を、はるかに高いリソース効率で実現しています。
本モデルは日本語のベンチマークにおいて最先端の結果を示し、言語の流暢さ(pfgen-bench)、指示遵守能力(M-IFEval Japanese)、知識評価(Jaster)に優位性を持ちます。商用バージョンであるPLaMo 2.0 Primeは、日本語のトークン効率を45%改善するカスタムトークナイダーを導入し、コンテキスト長を32,000トークンに倍増させ、API価格を前世代と比較して75%以上削減しました。複雑な数学的推論やコード生成において一部の専門的な競合モデルに遅れを取る面もありますが、QommonsAIやTachyon AIなどのサービスへの成功した導入実績から、日本語アプリケーション向けの第一線級の選択肢として確立されています。
出典
分析生成日: 2026-05-23