ブログ一覧に戻る
Anthropic

2026年6月のフロンティアAIモデル動向:Claude Fable 5の衝撃と安全性の両立

2026年6月、AI業界は未曾有の転換点を迎えている。AnthropicがClaude Fable 5を発表し、ほぼ全てのテストされたベンチマークでSOTA(State-of-the-Art)を達成した。しかし、直後に米政府の輸出規制によりアクセスが一時停止されるという劇的な展開が起きた。本記事では、2026年6月現在のフロンティアAIモデルの動向と、安全性と能力の両立という課題について深く掘り下げる。

Claude Fable 5:Mythosクラスの能力を一般公開

発表概要

Anthropicは2026年6月9日、Claude Fable 5を発表した。これは「Mythosクラス」とされる最上位モデルの能力を、安全な形で一般ユーザーに公開するものだ。

Fable 5の能力は、Anthropicがこれまでに公開したどのモデルよりも優れており、ソフトウェアエンジニアリング、ナレッジワーク、ビジョン、科学研究など、ほぼ全てのテストされたAI能力ベンチマークで最先端を達成している。タスクが長く複雑になるほど、他のモデルとの差が大きくなるという。

価格設定

Fable 5とMythos 5の価格は:

  • 入力: $10/100万トークン
  • 出力: $50/100万トークン

これはClaude Mythos Previewの半分以下の価格であり、高度なAI能力をより多くのユーザーに届けるというAnthropicの目標を体現している。

主要な能力向上

ソフトウェアエンジニアリング

Stripe社の早期テストによると、Fable 5は「数ヶ月のエンジニアリング作業を数日に圧縮」した。5000万行のRubyコードベースで、チームが2ヶ月以上かけて行う大規模な移行を1日で完了させた。

CognitionのFrontierCode評価では、高品質なプロダクションコードベースの基準を満たしながら困難なコーディングタスクを解決する能力が、フロンティアモデルの中で最も高いスコアを記録した。

ナレッジワーク

HebbiaのFinance Benchmark(上級レベルの推論テスト)では、Fable 5が全モデルで最高スコアを獲得。文書ベースの推論、チャートやテーブルの解釈、問題解決において大幅な改善が見られた。

ビジョン

Fable 5はビジョン関連タスクで新たなSOTAモデルとなった。詳細な科学図表から正確な数値を抽出したり、スクリーンショットだけからウェブアプリのソースコードを再構築したりする高度なビジョンタスクが可能。

特に注目すべきは、以前のClaudeモデルは補助ツールを使ってもPokemon FireRedを攻略するのが困難だったが、Fable 5は最小限のビジョンのみの環境でゲームを完全クリアしたことだ。

メモリと長コンテキスト

Fable 5は数百万トークンにわたる長時間タスクでも集中力を維持し、自身のノートを使用して出力を改善する。Slay the Spire(デッキビルディングゲーム)のテストでは、永続的なファイルベースのメモリへのアクセスがOpus 4.8の3倍の効果を発揮し、ゲームの最終アクト到達率も3倍だった。

安全性の新段階:安全分類器と規制

新しい安全分類器システム

Fable 5は、サイバーセキュリティ、生物学、蒸留(distillation)に関する3つの主要分野で新しい安全分類器(サフィケーション)を導入した。

  1. サイバーセキュリティ: Mythosクラスモデルはソフトウェア脆弱性の発見と悪用において驚異的な能力を示す。エージェント型ハッキング(偵察、発見、横断的移動など)も可能であり、悪用されるリスクが高いため、強力な分類器で保護。

  2. 生物学と化学: AAV(アデノ随伴ウイルス)設計タスクでは、Mythosクラスモデルが専用のタンパク質言語モデルを生物学的推論のみで上回った。遺伝子治療研究における前向きな応用が期待される一方、悪用リスクも存在。

  3. 蒸留対策: 大規模な能力抽出(蒸留)を検出し、安全保障上のリスクを軽減。

米政府の輸出規制

2026年6月12日、米政府はFable 5とMythos 5の全アクセスを一時停止する輸出規制指令を発令。これにより、Anthropicはこれらのモデルの提供を停止した。

この規制は、Mythosクラスモデルが持つ高度なサイバーセキュリティ能力が、悪意ある行為者にとって重大なリスクをもたらすことを示唆している。Project Glasswing(米政府との協力プログラム)を通じて、サイバーセキュリティ専門家にはMythos 5が提供されていたが、一般公開は見送られた。

他社の動向

OpenAI: GPT-5.5 Pro

OpenAIはGPT-5.5 ProをAPI経由で提供。高度な推論能力と長文処理において競争力を維持しているが、Fable 5との直接比較では若干劣る結果となっている。

Google: Gemini SparkとGemini Omni

Googleは2026年5月にGemini Spark(24時間365日対応のパーソナルAIエージェント)とGemini Omni(ビデオ作成パートナー)を発表。エージェント型AIの進化とマルチモーダル能力の向上に注力している。

業界への影響と今後の展望

開発者への影響

Fable 5の登場は、開発者のワークフローを根本的に変える可能性がある。CursorBenchやFrontierBenchで最高スコアを記録しており、長期間の推論や未知のツールへの汎化能力が向上。

GitHubの評価では、「開発者がより野心的な作業をエージェントに委任し、結果を信頼できる未来」を示唆している。

安全性と利用のトレードオフ

Fable 5の安全分類器は、95%以上のセッションでフォールバックが発生しない程度に調整されているが、5%未満のセッションで良性リクエストもブロックされる可能性がある。この偽陽性の問題は、今後の改善が課題。

エコシステムへの影響

  • コスト効率: Mythos Previewの半分以下の価格で同等以上の能力
  • アクセス層: Pro、Max、Team、Enterpriseプランで段階的に提供
  • データ保持: Mythosクラスモデルは30日間のデータ保持が必須

まとめ

2026年6月のAI業界は、Claude Fable 5の発表と米政府の規制という二つの大きな出来事によって、能力向上と安全性の両立という根本的な課題に直面している。

Fable 5はほぼ全てのベンチマークでSOTAを達成し、開発者ツールや科学研究において実用的な価値を示している。しかし、その高度な能力がもたらすリスクにより、完全な一般公開は見送られた状態。

今後注目すべきポイント:

  1. 規制の動向: 米政府の輸出規制が如何に展開するか
  2. 安全分類器の改善: 偽陽性の削減と安全性の向上
  3. エコシステムの進化: 開発者ツールやアプリケーションへの統合
  4. コスト競争: 価格設定と能力のバランス

AI業界は「より強力なモデルを、より安全に、より多くの人に」という目標に向かって進み続けているが、その道のりは容易ではない。安全性と能力の最適なバランスを見つけることが、今後のフロンティアAI開発の鍵を握る。

コメント (0)

シェア:Xはてブ

コメントを投稿

読み込み中...