AI-modellbarometer

En løpende og objektiv sammenligning av de kraftigste kunstig intelligens-språkmodellene på markedet, basert på standardiserte akademiske tester og sanntids API-priser.

Hvilken AI-modell er best akkurat nå?

Basert på våre aggregerte benchmark-analyser og tester fra Epoch AI, er for øyeblikket Gemini 3.1 Pro (Google) den sterkeste modellen på markedet med en solid gjennomsnittsscore på tvers av GPQA, SWE-Bench og SimpleQA. Modellen tilbys til en pris på ca. $2.00 per 1 million input-tokens.

Benchmark-data (GPQA, SWE-Bench, MATH, SimpleQA) fra Epoch AI. Prisinformasjon fra OpenRouter.

Modell	Utvikler	GPQA (Eksperttest)	SWE-Bench (Koding)	MATH Level 5 (Matte)	SimpleQA (Faktasjekk)	Pris / 1M Input Tokens	Sist sjekket
👑Gemini 3.1 Pro	Google	94.1%	75.6%	—	77.3%	$2.00	9. juli 2026
Gemini 3.5 Flash	Google	92.8%	79.3%	—	68.4%	$1.50	9. juli 2026
GPT-5.5	OpenAI	94.0%	80.6%	—	63.1%	$5.00	9. juli 2026
Qwen3.7-Max	Alibaba	91.6%	77.3%	—	58.5%	$1.25	9. juli 2026
DeepSeek-V4-Pro	DeepSeek	89.6%	77.6%	—	57.0%	$0.43	9. juli 2026
Mistral Medium 3	Mistral	59.5%	—	81.6%	—	$0.40	9. juli 2026
Llama 4 Maverick	Meta	67.0%	—	73.0%	—	$0.15	9. juli 2026
GLM-5.2	Zhipu AI	91.9%	78.7%	—	38.1%	$0.90	9. juli 2026
Claude Opus 4.8	Anthropic	91.0%	—	—	39.5%	$5.00	9. juli 2026
Kimi K2.7 Code	Moonshot	89.5%	—	—	39.2%	$0.74	9. juli 2026
Claude Sonnet 4.6	Anthropic	87.4%	75.2%	—	29.0%	$3.00	9. juli 2026
Grok 4.3 Beta	xAI	88.8%	—	—	38.0%	—	9. juli 2026
GPT-5.4 Mini	OpenAI	83.6%	—	—	28.6%	$0.75	9. juli 2026
Codex 5.2	OpenAI	—	—	—	—	$1.75	9. juli 2026

Ofte stilte spørsmål om barometeret.

Hva måler testene som vises i tabellen?+

GPQA er en svært vanskelig test utviklet av PhD-forskere innen biologi, fysikk og kjemi, og måler avansert akademisk resonnering. SWE-Bench måler modellens evne til å løse reelle programvare-bugs i store GitHub-repositorier. MATH Level 5 måler matematisk problemløsning på høyt akademisk nivå. SimpleQA, utviklet av OpenAI, måler faktapresisjon og tendens til hallusinasjoner — høyere score betyr mer pålitelige svar.

Hvor ofte oppdateres priser og benchmark-tall?+

Tallene i barometeret oppdateres automatisk 3 ganger i døgnet via synkroniseringsskript koblet mot databaser fra Epoch AI og sanntids API-priser fra OpenRouter.