AIモデルランキング

17種類のベンチマークによるAIモデル総合ランキング。カテゴリ別に詳細な比較が可能です。

総合ランキング

HLE、ARC-AGI-2、FrontierMath、SWE-bench、τ²-Bench の総合スコア

761 件のモデル

#モデル名開発元オープンソース
1Claude Mythos PreviewAnthropic64.793.9クローズド
2Claude Fable 5Anthropic59.095.0クローズド
3GPT-5.4 ProOpenAI58.783.338.0クローズド
4Muse SparkMeta AI58.042.514.677.4クローズド
5Claude Opus 4.8Anthropic57.988.6クローズド
6GPT-5.5 ProOpenAI57.284.639.6クローズド
7GLM-5.2Zhipu AI54.7クローズド
8Opus 4.7Anthropic54.775.822.987.6クローズド
9Kimi K2.6Moonshot AI54.080.2クローズド
10Qwen3.7-Max-Previewアリババ53.580.4クローズド
11Claude Opus 4.6Anthropic53.066.322.980.891.9クローズド
12GLM 5.1Zhipu AI52.3クローズド
13GPT-5.5OpenAI52.285.035.4クローズド
14GPT-5.4OpenAI52.177.127.1クローズド
15Gemini 3.1 Pro PreviewGoogle DeepMind51.477.116.780.690.8クローズド
16Kimi K2 ThinkingMoonshot AI51.071.3クローズド
17Qwen 3.6 Plus Previewアリババ50.678.8クローズド
18GLM-5Zhipu AI50.44.92.177.889.7クローズド
19Kimi K2.5Moonshot AI50.211.84.276.8クローズド
20Qwen3.6-Max-Previewアリババ50.278.8クローズド
21GPT-5.2 ProOpenAI50.054.231.3クローズド
22Qwen3-Max-Thinkingアリババ49.875.382.1クローズド
23Claude Sonnet 4.6Anthropic49.058.38.379.6クローズド
24Qwen3.5-27Bアリババ48.572.479.0クローズド
25Gemini 3 Deep Think - 2620Google DeepMind48.484.6クローズド
26Qwen3.5-397B-A17Bアリババ48.376.486.7クローズド
27DeepSeek-V4-ProDeepSeek48.280.6クローズド
28Gemini 3.0 Pro (Preview 11-2025)Google DeepMind45.845.118.876.285.4クローズド
29GPT-5.2OpenAI45.554.218.880.082.0クローズド
30DeepSeek-V4-FlashDeepSeek45.179.0クローズド