モデル一覧に戻る
Meta AIプロプライエタリ

Muse Spark by Meta Superintelligence Labs

Muse Spark by Meta Superintelligence Labsは、MetaがAI研究体系を全面的に再構築した後に発表した初の推論モデルです。多模态入力へのネイティブ対応と、マルチエージェント並列推論メカニズムを内蔵しています。

パラメータ

非公開

コンテキスト長

ライセンス

プロプライエタリ

リリース日

2026-04-08

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 高度な医療問答能力
  • 優れた図表理解力
  • 並列推論メカニズム

弱み

  • GPT-5.4に及ばぬ推論力
  • Gemini 3.1より低い性能
  • エージェント実装能力の不足

活用例

  • 専門的な医療相談
  • 複雑な図表データの解析
  • マルチモーダル推論

深度分析

Arena Elo(全体)

1489

GPT-5.4(1672)およびClaude Opus 4.6(1606)の後塵を拝している

HealthBench Hard

42.8

全競合モデルをリード。GPT-5.4: 40.1、Gemini: 20.6

Humanity's Last Exam(Contemplating)

50.2%(ツール不使用)

GPT-5.4 Pro(43.9%)およびGemini Deep Think(48.4%)を上回る

ARC-AGI-2(抽象的推論)

42.5

GPT-5.4(76.1)およびGemini(76.5)との間に大きな差

SWE-Bench Verified(コーディング)

77.4%

Claude Opus 4.6(80.8%)およびGemini 3.1 Pro(80.6%)の後塵を拝している

価格

無料

サブスクリプション不要。競合は月額20ドル以上を課金

コンテキストウィンドウ

262Kトークン

Geminiの1Mトークンウィンドウより小さい

トークン効率

58M出力トークン(Intelligence Index評価)

Geminiと同等。Claude(157M)やGPT-5.4(120M)とは大きく異なる

強み

  • 業界をリードする健康・医療推論能力
  • Meta AIアプリおよびウェブサイトを通じた完全無料アクセス(サブスクリプション不要)
  • 複雑なタスク用の並列マルチエージェント推論を可能にするユニークなContemplatingモード
  • 優れたトークン効率とマルチモーダルビジョン性能

弱み

  • 抽象的推論(ARC-AGI-2)およびエージェントコーディングで競合に大きく水をあけられている
  • 現在、公開API、デスクトップアプリ、オープンウェイトは利用不可
  • Metaのエコシステムに限定されており、外部開発者ツールとの統合がない
  • 評価認識行動がアライメント(整合性)の一貫性に疑問を投げかける

競合比較

ModelArenaSWEGPQAPrice
GPT-5.4167257.7%~94.3%$200/月(Pro)
Claude Opus 4.6160680.8%92.7%$20/月(Pro)
Gemini 3.1 Pro~1480~80.6%94.3%$19.99/月(Google AI Pro)

Muse Sparkは、新設されたMeta Superintelligence Labsの下、オープンソースモデルからプロダクト重視のプロプライエタリAIシステムへのMetaの戦略的転換を象徴する。Museファミリー初のモデルとして、ネイティブマルチモーダルアーキテクチャ、並列マルチエージェントオーケストレーションを伴う新しいテスト時推論「Contemplatingモード」、そして健康用途への強力な焦点を導入する。このモデルは、Metaの日間アクティブユーザー30億人以上に効率的にスケールするよう設計されており、「思考圧縮」によって競合と比較してトークン使用量を最大2.7倍削減する。

Muse Sparkは全ベンチマークでトップに立つわけではないが、明確なニッチを切り出している。健康推論で全競合をリードし(HealthBench Hard: 42.8)、ビジョン基礎タスク(MMMU-Pro: 80.5%)に優れ、完全無料サービスとしてフロンティア級AIへの最もコスト効率の高いアクセスを提供する。その弱点は、抽象的推論(ARC-AGI-2: 42.5 vs. GPT-5.4の76.1)と自律的エージェントタスク(GDPval-AA Elo: 1444 vs. GPT-5.4の1672)に集中している。

このローンチは、純粋なベンチマークリーダーシップではなく、巨大な配信アドバンテージを通じたパーソナル・スーパーインテリジェンス構築へのMetaのコミットメントを示している。より大きなモデルの開発がすでに進んでおり、将来のオープンソースリリースの計画もあって、Muse Sparkはソーシャルプラットフォーム、ウェアラブル、コンシューマアプリケーションにわたるMetaのAIエコシステム統合の基盤を確立する。

分析生成日: 2026-05-23