マイクロソフト MAI-Thinking-1:初の完全自研推論モデル、AIME 2025 スコア97%
2026年6月2日、マイクロソフトはBuild 2026でMAI-Thinking-1を正式にリリースした。これはマイクロソフト史上初の完全自研推論モデルであり、OpenAIやDeepSeekの蒸留技術に依存しない。AIME 2025スコアは**97.0%**で、マイクロソフトがAI基盤モデル分野で正式に独立したことを示す。
日本のAI業界にとって、これはマイクロソフトがもはやOpenAIの「販売店」ではなく、独立したAIモデル競争者になったことを意味する。
モデル仕様
| 項目 | 仕様 |
|---|---|
| 開発元 | Microsoft |
| アーキテクチャ | スパースMoE(混合エキスパート) |
| 総パラメータ数 | 約1兆(1T) |
| アクティブパラメータ数 | 350億(35B) |
| コンテキストウィンドウ | 256Kトークン |
| 学習データ | 30Tトークン(50%以上がコード) |
| 学習ハードウェア | 8,000基のGB200 GPU |
| 蒸留 | ❌ 完全自研、第三者蒸留なし |
| リリース日 | 2026年6月2日(Build 2026) |
ベンチマークテスト結果
| ベンチマークテスト | MAI-Thinking-1 | Claude Sonnet 4.6 | DeepSeek V3.2 | Claude Opus 4.6 |
|---|---|---|---|---|
| AIME 2025 | 97.0% | 95.6% | 93.1% | 99.8% |
| AIME 2026 | 94.5% | — | — | — |
| SWE-Bench Pro | 52.8% | — | — | — |
| LiveCodeBench v6 | 87.7% | — | — | — |
MAI-Thinking-1はAIME 2025で**97.0%**を達成し、Claude Sonnet 4.6(95.6%)やDeepSeek V3.2(93.1%)を凌駕した。Claude Opus 4.6(99.8%)に次ぐ結果だ。
ただし、これらはマイクロソフト自己申告データであり、独立した再現検証が必要である。
マイクロソフト MAI モデルファミリー
マイクロソフトはBuild 2026で同時に7つのMAIモデルを発表した:
| モデル | タイプ | 説明 |
|---|---|---|
| MAI-Thinking-1 | 推論 | フラッグシップ推論モデル、本記事の焦点 |
| MAI-Code-1-Flash | コーディング | Copilot用の高速コーディングモデル |
| MAI-Image-2.5 | 画像生成 | 画像生成モデル |
| MAI-Image-2.5 Flash | 画像生成 | 高速画像生成 |
| MAI-Voice-2 | 音声 | 音声モデル |
| MAI-Voice-2 Flash | 音声 | 高速音声モデル |
| MAI-Transcribe-1.5 | 転写 | 音声転写モデル |
これは何を意味するか?
1. マイクロソフトはOpenAI依存を脱却
2026年4月、マイクロソフトはOpenAIとの協力協定を改訂し、自社基盤モデルの開発を許可された。MAI-Thinking-1のリリースは、マイクロソフトが正式にOpenAIの技術販売店から独立した競争者に転換したことを示す。
2. GB200 GPUクラスターでの学習
MAI-Thinking-1は8,000基のGB200 GPUで学習された。これは現在知られている中で最大規模のGB200クラスター学習の一つだ。GB200はNVIDIAの最新フラッグシップGPUであり、マイクロソフトがハードウェアリソースに多大な投資を行ったことを示している。
3. コード学習データが50%以上を占める
学習データの50%以上がコードであり、これはSWE-Bench Pro(52.8%)やLiveCodeBench(87.7%)での強力な性能を説明する。コーディングシナリオにおいて、MAI-Thinking-1は競争力のある選択肢となりうる。
使用シナリオ推奨
| 使用シナリオ | 推奨モデル | 理由 |
|---|---|---|
| 数学推論(AIME類) | MAI-Thinking-1 | AIME 2025 97.0%、Opus 4.6に次ぐ |
| 日常コーディング支援 | MAI-Code-1-Flash | Copilot統合、高速 |
| 複雑な推論とアーキテクチャ設計 | Claude Opus 4.8 | 総合能力が最強 |
| 大規模バッチ処理 | MAI-Thinking-1 | MoEアーキテクチャ、推論効率が高い |
| データ機密環境 | MAI-Thinking-1 | マイクロソフトAzureホスティング、企業級セキュリティ |
まとめ
MAI-Thinking-1のリリースは、マイクロソフトのAI戦略の根本的な転換を示す。
主要な結論:
- 初の完全自研推論モデル — OpenAIやDeepSeekからの蒸留なし
- AIME 2025スコア97.0% — Claude Sonnet 4.6を凌駕、Opus 4.6に次ぐ
- 8,000基のGB200 GPUで学習 — 最大規模GB200クラスターの一つ
- 7つのMAIモデルを同時発表 — 推論、コーディング、画像、音声、転写をカバー
- マイクロソフトが正式に独立したAI競争者に — OpenAIの販売店ではなくなる
日本企業にとって、MAI-Thinking-1は新しい選択肢を提供する:マイクロソフト直接サポート、Azureホスティング、企業級セキュリティを持つ推論モデルだ。マイクロソフトがMAIモデルをCopilotやAzure AIに統合するにつれ、その実際の影響力が徐々に明らかになるだろう。
関連記事
- NVIDIA Nemotron TwoTower:拡散言語モデルが2.42倍の推論加速を実現
- Kimi K2.7 Code、GitHub Copilotに参入:オープンソースモデル初の主要開発ツールチェーン統合
- [Claude Sonnet 5発表:Anthropic最強中端モデルがGPT-5.5を全面的に超越](/blog/claude-sonnet-5-deep-dive)
読み込み中...