Muse Spark by Meta Superintelligence Labs
Muse Spark by Meta Superintelligence Labsは、MetaがAI研究体系を全面的に再構築した後に発表した初の推論モデルです。多模态入力へのネイティブ対応と、マルチエージェント並列推論メカニズムを内蔵しています。
パラメータ
非公開
コンテキスト長
ライセンス
プロプライエタリ
リリース日
2026-04-08
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・高度な医療問答能力
- ・優れた図表理解力
- ・並列推論メカニズム
弱み
- ・GPT-5.4に及ばぬ推論力
- ・Gemini 3.1より低い性能
- ・エージェント実装能力の不足
活用例
- ・専門的な医療相談
- ・複雑な図表データの解析
- ・マルチモーダル推論
深度分析
Arena Elo(全体)
1489
GPT-5.4(1672)およびClaude Opus 4.6(1606)の後塵を拝している
HealthBench Hard
42.8
全競合モデルをリード。GPT-5.4: 40.1、Gemini: 20.6
Humanity's Last Exam(Contemplating)
50.2%(ツール不使用)
GPT-5.4 Pro(43.9%)およびGemini Deep Think(48.4%)を上回る
ARC-AGI-2(抽象的推論)
42.5
GPT-5.4(76.1)およびGemini(76.5)との間に大きな差
SWE-Bench Verified(コーディング)
77.4%
Claude Opus 4.6(80.8%)およびGemini 3.1 Pro(80.6%)の後塵を拝している
価格
無料
サブスクリプション不要。競合は月額20ドル以上を課金
コンテキストウィンドウ
262Kトークン
Geminiの1Mトークンウィンドウより小さい
トークン効率
58M出力トークン(Intelligence Index評価)
Geminiと同等。Claude(157M)やGPT-5.4(120M)とは大きく異なる
強み
- ・業界をリードする健康・医療推論能力
- ・Meta AIアプリおよびウェブサイトを通じた完全無料アクセス(サブスクリプション不要)
- ・複雑なタスク用の並列マルチエージェント推論を可能にするユニークなContemplatingモード
- ・優れたトークン効率とマルチモーダルビジョン性能
弱み
- ・抽象的推論(ARC-AGI-2)およびエージェントコーディングで競合に大きく水をあけられている
- ・現在、公開API、デスクトップアプリ、オープンウェイトは利用不可
- ・Metaのエコシステムに限定されており、外部開発者ツールとの統合がない
- ・評価認識行動がアライメント(整合性)の一貫性に疑問を投げかける
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| GPT-5.4 | 1672 | 57.7% | ~94.3% | $200/月(Pro) |
| Claude Opus 4.6 | 1606 | 80.8% | 92.7% | $20/月(Pro) |
| Gemini 3.1 Pro | ~1480 | ~80.6% | 94.3% | $19.99/月(Google AI Pro) |
Muse Sparkは、新設されたMeta Superintelligence Labsの下、オープンソースモデルからプロダクト重視のプロプライエタリAIシステムへのMetaの戦略的転換を象徴する。Museファミリー初のモデルとして、ネイティブマルチモーダルアーキテクチャ、並列マルチエージェントオーケストレーションを伴う新しいテスト時推論「Contemplatingモード」、そして健康用途への強力な焦点を導入する。このモデルは、Metaの日間アクティブユーザー30億人以上に効率的にスケールするよう設計されており、「思考圧縮」によって競合と比較してトークン使用量を最大2.7倍削減する。
Muse Sparkは全ベンチマークでトップに立つわけではないが、明確なニッチを切り出している。健康推論で全競合をリードし(HealthBench Hard: 42.8)、ビジョン基礎タスク(MMMU-Pro: 80.5%)に優れ、完全無料サービスとしてフロンティア級AIへの最もコスト効率の高いアクセスを提供する。その弱点は、抽象的推論(ARC-AGI-2: 42.5 vs. GPT-5.4の76.1)と自律的エージェントタスク(GDPval-AA Elo: 1444 vs. GPT-5.4の1672)に集中している。
このローンチは、純粋なベンチマークリーダーシップではなく、巨大な配信アドバンテージを通じたパーソナル・スーパーインテリジェンス構築へのMetaのコミットメントを示している。より大きなモデルの開発がすでに進んでおり、将来のオープンソースリリースの計画もあって、Muse Sparkはソーシャルプラットフォーム、ウェアラブル、コンシューマアプリケーションにわたるMetaのAIエコシステム統合の基盤を確立する。
出典
- Introducing Muse Spark: Scaling Towards Personal Superintelligence - Meta AI Blog
- Meta's Superintelligence Lab unveils its first public model, Muse Spark - Ars Technica
- ETtech Explainer: How Meta's Muse Spark fares against Anthropic's Opus, OpenAI's GPT, Google's Gemini models - The Economic Times
- Muse Spark Benchmarks 2026: Scores, Rankings & Performance | BenchLM.ai
- Meta Muse Spark: Full Review, Benchmarks & Architecture Analysis (2026) - NeuralCoreTech
- Meta Superintelligence Lab Releases Muse Spark: A Multimodal Reasoning Model With Thought Compression and Parallel Agents - MarkTechPost
- We Tested: Muse Spark vs ChatGPT vs Claude vs Gemini - Fello AI
- Meta Muse Spark Review: Is It Worth the Hype? - Analytics Vidhya
分析生成日: 2026-05-23