Kimi K2.6
Kimi K2.6は、Moonshot AIが開発した大規模な推論モデルです。約10兆パラメータという膨大な規模を誇り、256Kの広範なコンテキストウィンドウを備えています。
パラメータ
10000.0B
コンテキスト長
256K
ライセンス
https://huggingface.co/moonshotai/Kimi-K2-Base/raw/main/LICENSE
リリース日
2026-04-20
API料金
入力料金(1Mトークンあたり)
$0.95
出力料金(1Mトークンあたり)
$
課金モード: standard
強み
- ・10兆パラメータの巨大規模
- ・高度な推論能力の実現
- ・256Kの長い文脈処理能力
弱み
- ・クローズドなライセンス形式
- ・巨大なパラメータによる負荷
- ・詳細な性能指標の不足
活用例
- ・複雑な論理的推論タスク
- ・超長文ドキュメントの解析
- ・高度な専門知識の処理
深度分析
SWE-Bench
68.5%
中規模モデルで優秀
入力価格
$0.50/1M
コスト効率
出力価格
$2.00/1M
低コスト
コンテキスト
256Kトークン
長め
強み
- ・月之暗面の最新モデル
- ・長コンテキスト対応
- ・コスト効率が良い
- ・中国語と英語のバイリンガル性能
弱み
- ・API利用が限定的
- ・フロンティアモデルに劣る場合がある
- ・ドキュメントが限定的
競合比較
| Model | Arena | GPQA | Price |
|---|---|---|---|
| Claude Opus 4.6 | 1548–1565 | 91.3% | $15/$75 per 1M |
| GPT-5.4 (xhigh) | N/A | 92.8% | $2.50/$15 per 1M |
| Gemini 3.1 Pro | N/A | 94.3% | ~$1.25/$5 per 1M |
モデル: Kimi K2.6 分野: 概要
Kimi K2.6は、Moonshot AIの旗艦オープンウェイト推論・エージェンティックコーディングモデルであり、1兆パラメータのMixture-of-Expertsアーキテクチャを基盤とし、トークンあたりわずか約320億パラメータをアクティブ化する。2026年4月20日にリリースされ、主要ベンチマーク全てでK2.5からの決定的な進歩を示すとともに、継続的な自律実行のための本番レベル機能を導入した:12時間の連続コーディングセッション、最大300個の並列サブエージェントによる4,000ステップの連携、および長期セッションでのドリフト防止のため自動圧縮機能を備えた256Kコンテキストウィンドウ。
このモデルの競争上のポジショニングは、業界において独自の位置づけにある。ソフトウェアエンジニアリングベンチマーク(SWE-Bench Pro: 58.6%)、ツール拡張推論(HLE-Full with tools: 54.0%)、および深層事実検索(DeepSearchQA: 92.5 f1)において、独自のフロンティアシステムを含むすべてのテスト済みモデルをリードしている。SWE-Bench VerifiedではClaude Opus 4.6およびGemini 3.1 Proと互角の戦いを繰り広げている(80.2%対80.8%対80.6%)。ただし、ツールなしの純粋な推論タスクでは、クローズドモデルに3〜5ポイント譲る。例えばHLE-Full(34.7対Geminiの44.4)やAIME 2026(96.4対GPT-5.4の99.2)などである。
K2.6の最も破壊的な特徴はその価格設定である。100万トークンあたり入力/出力$0.95/$4.00(またはMoonshot公式API経由で$0.60/$2.50)という価格は、同等のワークロードにおいてClaude Opus 4.6より5〜25倍、GPT-5.4より2〜5倍低コストである。完全なセルフホスティングと商用利用を可能とするModified MITライセンスと組み合わせることで、K2.6は真正のフロンティア能力を持つ初めてのオープンウェイトモデルであり、大容量のエージェンティックおよびコーディングワークフローにおいて、独自APIに対する経済的に実現可能な代替手段を提供する。Vercel(Next.jsベンチマークで>50%改善)、Factory.ai(+15%)、およびCodeBuddy(精度+12%、安定性+18%)からのパートナー検証は、その本番運用準備完了を確認している。
出典
- Kimi K2.6 | Open Model for Long-Horizon Coding and Agents (Replicate)
- Kimi K2.6 Matches Open Qwen3.6 Max and DeepSeek V4 (DeepLearning.ai The Batch)
- Kimi K2.6 Benchmarks: How It Compares to Claude Opus 4.6, GPT-5.4 and Gemini 3.1 Pro (Hyperstack)
- Kimi K2.6 Benchmarks 2026: Scores, Rankings & Performance (BenchLM.ai)
- Kimi K2.6 vs Claude Opus 4.6 vs GPT-5.4 vs Gemini 3.1 Pro (Lushbinary)
- Kimi K2 Review After 30 Days of Coding Tests and Agent Work (RoboRhythms)
- Kimi K2.6 Benchmark: Results vs GPT-5.4, Claude, Gemini, and K2.5 (Zenn.dev)
- Kimi K2.6 on AI Gateway (Vercel Changelog)
分析生成日: 2026-05-23