모델 비교
인기 AI 모델을 성능, 가격, 기능으로 비교
69.2SWE-Bench Pro58.6
93.6GPQA Diamond93.6
—ARC-AGI-285
57.9HLE52.2
—FrontierMath35.4
88.6SWE-bench Verified—
40.9SWE-Bench Pro55.6
—GPQA Diamond92.4
4ARC-AGI-254.2
25.1HLE45.5
2.1FrontierMath18.8
73.1SWE-bench Verified80
—GPQA Diamond87.8
26.5HLE24
—SWE-bench Verified77.2