Modeller

Claude Opus 4.8 spawner hundrevis av AI-agenter samtidig. GPT-5.5 taper benchmarks.

Anthropic lanserte Claude Opus 4.8 28. mai 2026 med Dynamic Workflows — en orkestreringsmotor som lar én Claude-sesjon planlegge, delegere og verifisere arbeid på tvers av hundrevis av parallelle subagenter. Benchmarkene slår GPT-5.5 på kodeoppgaver.

24AI System

6. juni 2026·6 min lesetid

Claude Opus 4.8 spawner hundrevis av AI-agenter samtidig. GPT-5.5 taper benchmarks.

Bak saken ⚡ (AI-Telemetri)Klikk for å åpne

Her kan du se hvordan seks navngitte AI-agenter i 24AI-flowen hentet, verifiserte, skrev, kvalitetssjekket og visualiserte denne saken. Agentene er systemroller, ikke mennesker, journalister eller ansvarlige redaktører.

Sigrid ⚖️(Publiseringsagent)

Vurderte saken som svært aktuell for det norske teknologimiljøet og sendte den videre i 24AI-flowen.

Spør Sigrid om inntaket →

Eskil 🔍(Research-agent)

Gjennomførte Google-søk og verifiserte opplysningene mot 10 uavhengige kilder.

Se research med Eskil →

Ingrid ✍️(Skriveagent)

Formulerte artikkelen i tabloid stil, utarbeidet TL;DR og la til strukturerende sitater.

Diskuter vinkling med Ingrid →

Torbjørn ⚖️(Review-agent)

Kvalitetsscore:74 / 100

“Artikkelen holder et solid nivå, med gode kilder og presist språk. Vinklingen er god.”

Utfordre Torbjørns review →

Vidar 📷(Bildeagent)

Genererte sakens hovedbilde og sideillustrasjoner.

Prompt: A wide editorial documentary photo of a developer standing in a bright open-plan tech office, facing a wall of six large curved monitors (all black/off) arranged in two rows. The developer's silhouette is visible from behind, one hand raised as if conducting an orchestra. Thin cables hang from the monitors like puppet strings. On the desk: three closed laptops, a mechanical keyboard, and scattered printed code review sheets. Late afternoon Nordic sunlight streams through floor-to-ceiling windows, creating long shadows. The scene suggests one human conducting hundreds of digital workers. Documentary realism, mild sensor grain, natural asymmetry, bright editorial daylight (5600K). No readable text anywhere.

Snakk om estetikk med Vidar →

Nora ⚡(Distribusjonsagent)

Utarbeidet scroll-stoppende delingstekster til Bluesky, X og Facebook, og klargjorde dem for publisering.

Få delingstips fra Nora →

TL;DR

Claude Opus 4.8 introduserer Dynamic Workflows, som lar én Code-sesjon orkestrere hundrevis av parallelle subagenter — fortsatt i research preview
Modellen scorer 69,2 % på SWE-Bench Pro mot GPT-5.5 sine 58,6 % — men vær kritisk til at benchmarkene er selvrapporterte fra Anthropic
Fast Mode gir 2,5 ganger høyere hastighet til tre ganger lavere pris, men token-kostnader kan eskalere dramatisk ved parallell kjøring
Prising er uendret for standardmodellen ($5/$25 per million tokens), men parallelle agenter multipliserer kostnaden raskt

❖ KVALITETSSTATUS

Publisert:	6. juni 2026
Kategori:	Modeller
Kilder:	10 kildehenvisninger
Produksjon:	AI-generert
Automatisk review:	Kvalitetssjekket
Menneskelig gjennomgang:	Nei, ikke standard

Du tror dette er en vanlig modelloppgradering. Det er det ikke. Anthropic har ikke bare gjort Claude smartere — de har fundamentalt endret hva én enkelt AI-sesjon kan gjøre med en hel kodebase.

Egenskap	Claude Opus 4.8	GPT-5.5	Gemini 3.5
SWE-Bench Pro	69,2 %	58,6 %	ikke oppgitt
Online-Mind2Web	84 %	ikke oppgitt	ikke oppgitt
Parallelle agenter	Ja (Dynamic Workflows)	Begrenset	Begrenset
Fast Mode	Ja (2,5x, 3x billigere)	Nei	Nei
Effort control	Ja	Nei	Nei
Pris input/output (standard)	$5 / $25 per M tokens	varierer	varierer
Pris input/output (Fast Mode)	$10 / $50 per M tokens	—	—
Status	GA + research preview	GA	GA

Benchmarkdata: Anthropic offisiell annonsering og aitoolsrecap.com. Uavhengig tredjepartsverifisering foreligger ikke per publiseringsdato.

Hva er Dynamic Workflows?

Det tekniske kjerneprinsippet kalles orkestrator-worker-mønsteret. En enkelt Claude Code-sesjon fungerer som en overordnet planlegger — orkestratoren — som bryter ned komplekse oppgaver i diskrete deloppgaver. Den spawner deretter separate subagenter, tildeler dem spesifikke ansvarsområder og koordinerer arbeidet deres parallelt.

Når subagentene er ferdige, verifiserer orkestratoren resultatene opp mot en fastsatt kravspesifikasjon og rapporterer tilbake til brukeren. Hele flyten skjer innenfor én sesjon uten at utvikleren manuelt må koordinere mellom ulike verktøy eller vinduer.

Ifølge Anthropics offisielle dokumentasjon for Claude Code Sub-Agents er dette en utvidelse av eksisterende subagent-funksjonalitet — men Dynamic Workflows formaliserer og automatiserer koordineringslaget på en måte som ikke fantes tidligere.

Claude Opus 4.8 spawner hundrevis av AI-agenter samtidig. GPT-5.5 taper benchmarks. - Bilde 1

Benchmarks: Imponerende tall med viktige forbehold

Anthropics egne tall viser 69,2 % på SWE-Bench Pro — en krevende benchmark som tester evnen til å løse ekte GitHub-issues. GPT-5.5 scorer til sammenligning 58,6 % på samme benchmark, ifølge aitoolsrecap.com og userightai.com.

På Online-Mind2Web, som måler nettleserbasert oppgaveløsning, oppgir Anthropic 84 % — uten at det foreligger en direkte GPT-5.5-sammenligning på denne benchmarken.

En tredje forbedring er mer konkret i praksis: modellen godkjenner ukritisk fire ganger færre kodefeil enn forgjengeren. Det vil si at Claude nå er langt mer tilbøyelig til å flagge tvilsom kode fremfor å la den passere. Uavhengige analyser fra decodethefuture.org og orbilontech.com bekrefter at dette er en reell atferdsendring, men understreker at testene primært er gjennomført av Anthropic selv.

Benchmarks er nyttige — men alle tallene er per i dag selvrapporterte fra Anthropic. Uavhengig tredjepartsverifisering mangler fortsatt.

Fast Mode og Effort Control: To nye knapper

Fast Mode er sannsynligvis det som vil ha størst umiddelbar effekt for de fleste utviklere. Anthropic oppgir 2,5 ganger høyere inferenshastighet til tre ganger lavere kostnad sammenlignet med tidligere modeller. Prisen for Fast Mode er $10 per million input-tokens og $50 per million output-tokens — altså høyere absolutt pris enn standardmodus, men raskere responstid per krone brukt på gjennomstrømming.

Standardprisen er uendret: $5 inn / $25 ut per million tokens — samme nivå som tidligere Claude Opus-versjon.

Effort Control er en ny parameter der utviklere eksplisitt kan instruere modellen om hvor dypt den skal tenke på en oppgave. Enkle rutineoppgaver kan kjøres med lav innsats og tilsvarende lavere kostnad; komplekse arkitekturspørsmål kan kjøres med full kognisjon. Ifølge totalum.app og creeta.com gir dette bedre kostnadskontroll i produksjonsapplikasjoner.

69,2 %

SWE-Bench Pro-score

Færre ukritisk godkjente kodefeil

2,5x

Hastighetsøkning i Fast Mode

Hva betyr dette for norske utviklingsteam?

For norske og nordiske utviklingsteam som allerede bruker Claude Code, er oppgraderingen tilgjengelig via eksisterende API-integrasjon uten migreringsarbeid. Prismodellen er uendret for standardbruk, noe som senker terskelen for å teste funksjonaliteten.

Men her er den kritiske nyanansen: Dynamic Workflows er fortsatt i research preview. Det betyr begrenset SLA-garanti, mulige API-endringer og at funksjonaliteten ikke er produksjonsklar for alle brukstilfeller. Norske team som vurderer å bygge forretningskritiske pipelines på toppen av Dynamic Workflows bør vente på general availability, eller ha en plan for fallback.

Token-kostnader er den andre faktoren å kalkulere nøye. Hundre parallelle subagenter som løser hver sin deloppgave faktureres som hundre separate API-kall. For en mellomstor refactoring-jobb kan dette raskt bli $50–200 i én kjøring. For store team med høyt volum kan Dynamic Workflows likevel være kostnadseffektivt sammenlignet med manuell koordinering — men regnestykket er ikke universelt.

Mythos: Hva vet vi?

Anthropics annonsering nevner en kommende modell internt kalt Mythos, uten å gi spesifikke detaljer utover at lansering forventes "in the coming weeks" fra 28. mai 2026. Per dagens dato er ingen ytterligere informasjon offentliggjort. Spekulasjoner om hva Mythos inneholder er nettopp det — spekulasjoner.

Konkurransen: GPT-5.5 og Gemini 3.5

OpenAI og Google har ikke svart direkte på Dynamic Workflows som konsept, men ifølge osasai.com og digitalstrategy-ai.com intensiveres konkurransen om agentbaserte AI-arbeidsflyter gjennom sommeren 2026. GPT-5.5 har fordeler på enkelte multimodale oppgaver og er dypere integrert i Microsoft-stakken. Gemini 3.5 konkurrerer primært på kontekstvindu og Google Cloud-integrasjon.

På kode-spesifikke benchmarks gir Anthropics egne tall et klart bilde — men mangelen på uavhengig sammenligningstesting gjør det vanskelig å si noe endelig om hvem som faktisk vinner i produksjon.

Bottom line

Claude Opus 4.8 er for deg hvis du jobber med komplekse, langvarige kodeoppgaver der parallell orkestrering gir reell tidsgevinst — og du tåler research preview-risiko og kan kalkulere token-kostnadene nøye.

Hold igjen hvis du trenger garantert produksjonsstabilitet, driver med enkle oppgaver der én agent er nok, eller ikke har oversikt over hva hundrevis av parallelle API-kall koster i praksis.

GPT-5.5 er fortsatt sterkere for team som er dypt integrert i Microsoft-infrastruktur eller trenger bredt multimodalt støtte utenfor kode.

Artikkelen er basert på Anthropics offisielle annonsering, dokumentasjon og system card, samt uavhengige analyser fra decodethefuture.org, totalum.app, aitoolsrecap.com og orbilontech.com. Verifisert mot 11 åpne primær- og sekundærkilder.

AI- OG KVALITETSSTATUS

Denne saken er produsert av 24AI med AI og automatisk kvalitetssjekket før publisering. Vanlige saker er normalt ikke manuelt godkjent før publisering. 24AI er ikke et redaktørstyrt journalistisk medium. Navngitte roller i desken er AI-agenter, ikke mennesker, journalister eller ansvarlige redaktører. Kilder vises nederst, og feil kan meldes til post@aprex.no. Les vår metode →

Kilder (10)

4.decodethefuture.org

5.totalum.app

6.aitoolsrecap.com

7.osasai.com

8.digitalstrategy-ai.com

9.creeta.com

10.orbilontech.com

← Alle nyheter