解説2026-06-24

2026年6月 AIモデル総決算：Claude Fable 5の衝撃、GPT-5.6の延期、そして中国の四馬レース

2026年6月の概要

2026年6月は、LLM（大規模言語モデル）の歴史において、最も開発が集中した月となった。Anthropic、OpenAI、Google、Meta、NVIDIA、そして中国のフロンティア企業群まで、主要な開発ラボが2週間以内に次々と新モデルを発表した。本稿では、6月にリリースされたすべての主要モデルを網羅的に解説し、今後のAI業界への影響を分析する。

2026年6月リリースマップ

モデル	開発元	種別	リリース日	ポイント
Claude Fable 5	Anthropic	Mythosクラス	6月9日	SWE-Bench Verified 95.0%、SWE-Bench Pro 80.3%
Claude Mythos 5	Anthropic	Mythosクラス	6月9日	サイバーセキュリティ特化、限定公開
Claude Opus 4.8	Anthropic	メインストリーム	5月28日	現行フロンティアフラッグシップ
GPT-5.6	OpenAI	クローズド	7月中旬延期	カナリーテスト中、150万トークンコンテキスト
Gemini 3.2	Google	クローズド	6月初旬	長文脈リトリーブルアップグレード
Gemini 3.5 Pro	Google	クローズド	延期	DeepMindが品質に不満、今月リリースなし
Nemotron 3 Ultra	NVIDIA	オープン	6月4日	550Bパラメータ（55Bアクティブ）、MoE
Gemma 4 12B	Google	オープン	6月3日	エンコーダーなしマルチモーダル、QAT対応
Qwen 3.7	Alibaba	オープン+クローズド	6月上旬	エージェント特化、3モデル展開
Llama 4	Meta	オープン	4月5日	マルチモーダル、エージェント対応
DeepSeek V4 Pro	DeepSeek	オープン+クローズド	4月24日	16兆パラメータ、100万トークン
Mistral Medium 3	Mistral AI	クローズド+セルフホスト	6月上旬	EU多言語ミッドティア
Hy3 Preview (Hunyuan 3)	Tencent	オープン	4月23日	MoE 295B、エージェント対応
ERNIE 5.1	Baidu	クローズド	6月上旬	Baidu検索統合
Doubao	ByteDance	クローズド	未確認	公式発表なし
GLM-5.2	Zhipu AI	オープン	6月16日	100万トークン、MITライセンス、MoE

Claude Fable 5：Mythosクラスの衝撃

Anthropicは6月9日、Claude Fable 5を発表した。これは「Mythosクラス」と名付けられた新ティアの最初の一般公開モデルであり、従来のOpusを上回る最上位モデル群に位置づけられる。

ベンチマーク成績

Fable 5の性能は圧倒的だ。

SWE-Bench Verified: 95.0% — ほぼ完璧なスコア
SWE-Bench Pro: 80.3% — Opus 4.8の69.2%を16%上回り、GPT-5.5の58.6%から38%先んじている
GDP.pdf（ドキュメント推論）: 29.8% — GPT-5.5の24.9%を上回る
コンテキストウィンドウ: 100万トークン（最大出力128K）

Stripe社は5,000万行のRubyコードベースでテストし、手動では2ヶ月かかる大規模マイグレーションを1日で完了させた。CursorのMichael Truell氏は「CursorBenchで最先端のモデル」と評価している。

価格設定

Fable 5の価格は以下の通りだ。

入力: $10 / 100万トークン
出力: $50 / 100万トークン

これはOpus 4.8の約2倍に相当する。Pro、Max、Teamプランでは6月22日まで無料で利用できた。

制限と安全性

注意すべき点もある。センシティブな生物学やサイバーセキュリティに関する質問では、より弱いモデルへルーティングされる。制限のない兄弟モデル「Mythos 5」は、サイバーセキュリティ担当者やインフラプロバイダーに限定公開されており、BioMysteryBenchで46.1%のスコアを記録している。

OpenAI GPT-5.6：延期と新展開

7月中旬への延期

OpenAIは当初6月30日頃のリリースを予定していたGPT-5.6を、7月中旬に延期した。6月23日のリークによると、カナリーテストは進行中だが、追加のポストトレーニングが必要との報告がある。

予測市場Polymarketでは6月30日までのリリース確率を89%と予測していたが、延期が確定した。

技術的な特徴

GPT-5.6は以下の点で注目される。

推論深度: 従来モデルより深い推論能力
トークン効率: マルチステップ作業でのトークン消費の最適化
150万トークンコンテキスト: 長文脈対応の強化
Bidi（新音声モデル）: 双方向音声対応、途中で割り込みやリアルタイム翻訳が可能

Codex 26.609の進化

6月11-12日にリリースされたCodex 26.609は、OpenAIのデスクトップIDEに進化し、ブラウザデバッグ機能を搭載。Developerモードにより、より高度な開発ワークフローが可能になった。

Google Gemini：成功と遅延

Gemini 3.2：長文脈リトリーブルの強化

GoogleはGemini 3.2を6月初旬にリリースした。これはマルチモーダルリフレッシュとして、長文脈リトリーブル能力の大幅な改善を実現した。

Gemini 3.5 Pro：品質問題で延期

一方、Google DeepMindはGemini 3.5 Proの品質に不満を表明し、今月のリリースを見送った。当初は6月末リリースが予定されていたが、現状では7月以降になる見込みだ。

Gemini 3.5 Flash：4倍高速化

Google I/OでGemini 3.5 FlashがGAリリースされ、従来比4倍の速度を実現。デフォルトモデルとしての採用を検討する価値がある。

オープンソースフロンティア

NVIDIA Nemotron 3 Ultra

NVIDIAが6月4日に発表したNemotron 3 Ultraは、550Bパラメータ（55Bアクティブ）のMoE（Mixture-of-Experts）モデルだ。Mamba-2とTransformerのハイブリッドアーキテクチャを採用し、長時間動作するエージェント向けに設計されている。

アーキテクチャ: LatentMoE（Mamba-2 + Transformer）
アクティブパラメータ: 55B（全体550Bの10%）
特徴: エージェント推論に最適化、エネルギー効率重視

Google Gemma 4 12B

6月3日にリリースされたGemma 4 12Bは、エンコーダーなしの統合マルチモーダルモデルだ。6月5日にはQAT（Quantization-Aware Training）版も公開され、モバイルやラップトップでの効率的な推論が可能になった。

Alibaba Qwen 3.7シリーズ

AlibabaはQwen 3.7を3つのバリエーションで展開する。

Qwen3.7-Max: フラッグシップ。長時間のエージェント作業に最適。
Qwen3.7-Plus: マルチモーダル推論・コーディング・ソフトウェア実行を統合。
Qwen3.7-Turbo: 高速・低コスト版。

Qwen 3.7-PlusはGUIエージェント機能を搭載し、ビルド・テスト・デプロイの一連のワークフローを自律的に実行できる。

Meta Llama 4

MetaのLlama 4は4月にリリースされ、マルチモーダル対応とエージェントワークフローの強化を特徴としている。

Mistral Medium 3

Mistral AIはEU市場向けの多言語ミッドティアモデルをリリース。セルフホストオプションも提供し、ヨーロッパ企業のプライバシー要件に対応する。

中国フロンティアの競争激化

2026年6月の最も注目すべき動向の一つは、中国フロンティアモデル間の急速な競争激化だ。DeepSeek V4が4月に確立した価格パフォーマンス基準に対し、Alibaba、Tencent、Baidu、Zhipu AIが短期間に次々と対抗モデルを発表した。

DeepSeek V4 Pro

DeepSeek V4 Proは、16兆パラメータと100万トークンのコンテキストウィンドウを備えたフロンティアモデル。4月にリリースされたV4シリーズの最新版で、コスト効率の面で引き続きリーダーシップを維持している。

Tencent Hy3 Preview（Hunyuan 3）

Tencentは4月にHy3 Preview（Hunyuan 3）をオープンソースで公開した。MoE 295Bパラメータ構成で、エージェント対応を強化している。

Baidu ERNIE 5.1

Baidu検索との統合により、検索結果の概要をAIが直接生成する体験を実現した。

ByteDance Doubao

ByteDanceはDoubaoモデルを展開しているが、6月時点での公式発表は確認されていない。

Zhipu AI GLM-5.2

6月16日にリリースされたGLM-5.2は、Zhipu AIの最新フラッグシップ。100万トークンのコンテキストウィンドウ、MITライセンス、MoEアーキテクチャを採用し、ロングホライズンタスクに特化している。

3つのマクロシフト

1. セーフティフロンティアの一般公開

Claude Mythos 5のGAリリースは、サイバーセキュリティ特化の推論能力が企業調達プロセスに組み込まれることを意味する。脆弱性を認識する推論が、ベンダーリスク評価の一部となる時代が来た。

2. 中国フロンティアの収束

Qwen、DeepSeek、Hunyuan、GLMの4社が短期間に相次ぎリリースしたのは偶然ではない。DeepSeek V4が確立した価格パフォーマンス基準への競争的応答だ。中国の消費者・企業市場において、ブランドの可視性を高める動きが急速に広がっている。

3. ユースケース別モデルファミリー

Claude Fable 5のリリースは、フロンティアラボがスケールティアだけでなく、ユースケース別のアーキタイプに基づいてモデルファミリーをセグメンテーションし始めたことを示唆する。クリエイティブ系（Fable）、セキュリティ系（Mythos）、汎用系（Opus）という分化が進んでいる。

実用的な選択ガイド

コーディングエージェント開発者向け

最優先: Claude Fable 5（SWE-Bench Pro 80.3%、Stripeでの実績あり）
コスト重視: Qwen 3.7-Plus（GUIエージェント対応、中国市場向け）
自己ホスト: Nemotron 3 Ultra（55Bアクティブ、エネルギー効率重視）

エンタープライズ向け

汎用: Claude Opus 4.8（現行フラッグシップ、安定供給）
Google エコシステム: Gemini 3.5 Flash GA（4倍高速化）
EU規制対応: Mistral Medium 3（セルフホスト、プライバシー重視）

中国市場向け

フラッグシップ: Qwen 3.7-Max
コスト効率: DeepSeek V4 Pro
消費者統合: Hy3 Preview（WeChat）

まとめ

Claude Fable 5がコーディング能力の新基準を確立し、中国フロンティア間の競争激化が業界の再編を加速させ、GPT-5.6とGemini 3.5 Proの延期は開発の複雑さを浮き彫りにした。

今後注目すべき点は以下の通りだ。

7月中旬のGPT-5.6リリース — OpenAIの反撃が本格化する
Gemini 3.5 Proの品質 — Googleが遅れを取り戻せるか
中国モデルのエコシステム展開 — オープンソース vs クローズドの行方
モデルファミリーの分化 — ユースケース別の最適化が加速する

フロンティアモデルの競争は、単なる性能比較から、エコシステム、価格設定、安全性を巡る多次元の競争へと移行している。開発者は、単一モデルへの依存を避け、タスクに応じたモデル選択戦略を持つことがますます重要になっている。

コメント (0)

シェア:X はてブ

読み込み中...

ブログ一覧に戻る