ELYZA-Thinking-1.0-Qwen-32B
ELYZAが開発した日本初の推論特化型モデル。OpenAIのo1/o3シリーズと同様の「思考の連鎖(Chain-of-Thought)」アプローチを採用し、複雑な推論タスクに特化している。
パラメータ
32B
コンテキスト長
32K
ライセンス
ELYZA License
リリース日
2026-01-15
日本語性能
日本企業が開発したモデルまたは日本語に特化したモデル。日本語の理解・生成能力が最も高い。
API料金
入力料金(1Mトークンあたり)
¥80
出力料金(1Mトークンあたり)
¥320
課金モード: standard
強み
- ・国産初の推論特化モデル
- ・数学・論理推論に強い
- ・日本語での思考プロセス可視化
- ・Qwen-32Bベースで安定した性能
弱み
- ・推論に時間がかかる
- ・コンテキスト長が32K
- ・通常のテキスト生成には不向き
- ・商用利用は要ライセンス確認
活用例
- ・数学的推論タスク
- ・論理的思考を要する問題解決
- ・日本語での複雑な分析
- ・教育分野での活用
深度分析
パラメータ
32B
軽量なオープンウェイトモデル
コンテキストウィンドウ
128K tokens
131072トークン
MATH-500(英語)
80.8%
o1-mini:80.0%と比較
MATH-500(日本語)
78.6%
o1-mini:77.2%と比較
JMMLU_small
73.1%
日本語知識ベンチマーク
ライセンス
Apache 2.0
商用利用可能
強み
- ・日本語と英語の両方で強力な数学的推論能力を持ち、主要ベンチマークでo1-miniを超えています。
- ・軽量(32Bパラメータ)でありながら、はるかに大きな推論モデルと競争力があります。
- ・商用利用が可能な寛容なApache 2.0ライセンスで完全にオープンソースです。
弱み
- ・コーディング性能(JHumanEval)はベースモデルと比較して低下し、競合他社に遅れをとっています。
- ・推論に特化したトレーニングにより、一部の一般的な日本語タスクの性能がわずかに低下しました。
- ・フル精度推論にはかなりのVRAM(約66GB)が必要で、アクセシビリティが制限されます。
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| OpenAI o1-mini | 該当なし | 該当なし | 該当なし | API専用(プレミアム) |
| DeepSeek-R1-Distill-Qwen-32B | 該当なし | 該当なし | 該当なし | オープンソース |
| QwQ-32B | 該当なし | 該当なし | 該当なし | オープンソース |
ELYZA-Thinking-1.0-Qwen-32Bは、ELYZAが開発した日本初の特化型推論モデルです。OpenAIのo1シリーズと同様のChain-of-Thought(CoT)アプローチを使用して、複雑な論理的および数学的問題に取り組みます。このモデルはAlibabaのQwen2.5-32B-Instructを基にしており、最適な推論パス探索のための革新的なモンテカルロ木探索(MCTS)ベースのアルゴリズムを使用して生成された約150,000の高品質合成データセットで微調整されています。このプロセスにより、320億パラメータのモデルが主要な推論ベンチマークでOpenAIのo1-miniと同等の性能を達成し、寛容なApache 2.0ライセンスの下でオープンウェイトのままです。
重要な革新はデュアルモデルアプローチです。主な推論モデルに加えて、ELYZAは同じ問題セットで訓練されたが長い推論プロセスのない「Shortcut Models」(32Bおよび7Bバリアント)をリリースしました。Shortcutモデルは一般的なタスクでGPT-4oと同等の性能を達成し、訓練中に開発された複雑な推論能力をより高速で直接的な応答モデルに蒸留できることを示しています。この研究は、強力かつ効率的なモデルを作成するために推論から開発フェーズへと重い計算コストを移すというAI開発の成長トレンドを強調しています。
数学的および論理的推論に優れている一方、モデルにはトレードオフがあります。コーディング能力はベースモデルと比較してわずかに低下しており、特化したトレーニングデータにコーディングタスクが不足していたことを示唆しています。それでも、日本語AIにとって重要なマイルストーンであり、特化した推論タスクの最先端を進める強力で商業的に実行可能なオープンソース推論モデルを提供します。
出典
- ELYZA-Thinking-1.0: MCTS を用いた推論パス探索と模倣学習による Reasoning Model の開発
- ELYZA、論理的思考能力を強化した「Reasoning Model」を開発、商用利用可能な形で公開しました|株式会社ELYZA 公式ブログ
- ELYZA、論理的思考能力を強化した「Reasoning Model」を開発、商用利用可能な形式で公開 | 株式会社ELYZAのプレスリリース
- Run ELYZA-Thinking-1.0-Qwen-32B API | Serverless Inference | 32K Context | Flat-Rate Pricing - Featherless.ai
- ELYZA Thinking 1.0 Qwen 32B by elyza — VRAM 65.8GB, 128K context | LLM Explorer
分析生成日: 2026-05-23