ランキング一覧に戻る

OpenClawランキング

Claw Bench、Pinch Bench によるOpenClawエージェント性能評価。

698 件のモデル

#モデル名開発元オープンソース
1GLM-5-TurboZhipu AI93.886.5クローズド
2Doubao Seed 2.0 Lite字节跳动Seed团队93.1クローズド
3GPT-5.4OpenAI92.790.5クローズド
4MiniMax M2.5MiniMax92.187.8クローズド
5GLM-5Zhipu AI91.786.4クローズド
6MiniMax-M2.7MiniMax91.787.1クローズド
7Opus 4.5Anthropic91.587.2クローズド
8Qwen3.5-35B-A3Bアリババ91.478.4クローズド
9GLM-5V-TurboZhipu AI90.1クローズド
10GPT-5.4 nanoOpenAI89.7クローズド
11Haiku 4.5Anthropic89.482.0クローズド
12Grok 4.1 FastxAI88.682.4クローズド
13Claude Sonnet 4.5Anthropic88.188.2クローズド
14Qwen3.5-122B-A10Bアリババ86.085.5クローズド
15Gemini 3.0 FlashGoogle DeepMind85.785.2クローズド
16Step 3.5 FlashStepFun84.985.3クローズド
17Kimi K2 ThinkingMoonshot AI82.5クローズド
18Kimi K2.5Moonshot AI81.784.8クローズド
19Kimi K2.6Moonshot AI80.9クローズド
20Gemini 2.5 Pro Experimental 03-25Google DeepMind80.471.9クローズド
21DeepSeek V3.2DeepSeek79.084.3クローズド
22Mistral Large 3Mistral78.672.2クローズド
23Claude Sonnet 4Anthropic77.880.5クローズド
24Qwen3-Coder-Nextアリババ75.879.1クローズド
25GPT-5.4 miniOpenAI75.3クローズド
26Qwen3.5-27Bアリババ75.290.0クローズド
27Qwen3.6-27Bアリババ72.4クローズド
28Nova 2 Liteアマゾン68.5クローズド
29ERNIE 5.0 Thinking Previewバイドゥ51.0クローズド
30Claude Mythos PreviewAnthropicクローズド

ベンチマークについて

Claw Bench
OpenClawエージェントベンチマーク — OpenClawプラットフォームでのエージェント性能を測定
Pinch Bench
OpenClawピンチベンチマーク — OpenClawプラットフォームでのタスク遂行能力を測定