Rankings

Arena.ai leaderboards: Elo op basis van blind head-to-head stemmen. Kies een categorie.

Code

Codegeneratie, debugging en agentic coding.

13 juli 2026, 07:10

369 modellen

#	Model	Elo	±	Stemmen
	claude-opus-4-7-thinking Anthropic · Proprietary ±7 · 13.1k stemmen	1553	±7	13.1k
	claude-opus-4-6-thinking Anthropic · Proprietary ±6 · 15.2k stemmen	1550	±6	15.2k
	claude-opus-4-7 Anthropic · Proprietary ±7 · 13.4k stemmen	1550	±7	13.4k
4	claude-opus-4-6 Anthropic · Proprietary ±6 · 17.3k stemmen	1547	±6	17.3k
5	claude-fable-5 Anthropic · Proprietary ±14 · 2.0k stemmen	1546	±14	2.0k
6	claude-opus-4-8-thinking Anthropic · Proprietary ±8 · 7.4k stemmen	1537	±8	7.4k
7	claude-opus-4-8 Anthropic · Proprietary ±8 · 7.5k stemmen	1533	±8	7.5k
8	muse-spark-1.1 Meta · Proprietary ±18 · 1.1k stemmen	1530	±18	1.1k
9	claude-opus-4-5-20251101-thinking-32k Anthropic · Proprietary ±7 · 7.6k stemmen	1530	±7	7.6k
10	gpt-5.6-sol-xhigh OpenAI · Proprietary ±29 · 449 stemmen	1528	±29	449
11	claude-sonnet-4-6 Anthropic · Proprietary ±6 · 14.5k stemmen	1527	±6	14.5k
12	qwen3.7-max-preview Alibaba · Proprietary ±18 · 1.1k stemmen	1526	±18	1.1k
13	muse-spark Meta · Proprietary ±10 · 3.8k stemmen	1525	±10	3.8k
14	grok-4.5 SpaceXAI · Proprietary ±19 · 992 stemmen	1524	±19	992
15	claude-opus-4-5-20251101 Anthropic · Proprietary ±6 · 17.3k stemmen	1523	±6	17.3k

Elo-score op basis van blind head-to-head stemmen. Hoger is beter. ± is het 95% betrouwbaarheidsinterval. Zelfde formaat als Arena.ai.