Anthropic har offisielt lansert Claude Fable 5, og presenterer den som den mest kapable modellen selskapet noensinne har gjort bredt tilgjengelig. Ifølge Anthropic selv vokser forspranget til konkurrentene jo mer krevende og langvarige oppgavene blir — noe som særlig er relevant for profesjonell bruk.
Fra hemmelig til offentlig: Mythos-klassen
Fable 5 representerer et historisk skifte for Anthropic. Modellen er den første i Mythos-familien som slippes til allmennheten. Tidligere ble hele Mythos-klassen holdt unna offentligheten fordi selskapets egne sikkerhetsvurderinger konkluderte med at modellene var for dyktige innen cybersikkerhet til å kunne lanseres uten videre — en vurdering som skapte intern debatt om ansvarlig AI-utvikling.
At Anthropic nå velger å gå bredt ut med Fable 5, signaliserer at selskapet mener det har funnet tilstrekkelige sikkerhetstiltak for å gjøre modellen tilgjengelig, ifølge The Verge.
Ytelsesfordelen skal øke jo lengre og mer komplekse oppgavene er — et trekk som skiller Fable 5 fra tidligere generasjoner

Sterk på kode og visuelle oppgaver
Anthropic trekker særlig frem tre styrkeområder for Fable 5: programvareutvikling, kunnskapsarbeid og visuell forståelse. Selskapet hevder modellen leverer eksepsjonell ytelse i alle tre kategoriene, og at den skiller seg mest fra konkurrentene nettopp i de oppgavene som krever lengre kjøretid og høyere kompleksitet.
Dette er i tråd med en trend vi har sett fra tidligere Anthropic-modeller. Til sammenligning scoret forgjengeren Claude 3.5 Sonnet 80,9 prosent på SWE-bench Verified — et anerkjent benchmark for programvareteknikk — mot GPT-4os rundt 70 prosent og Geminis cirka 65 prosent, ifølge tilgjengelige benchmark-data. Fable 5 skal bygge videre på denne posisjonen.
Et kapprøp med høye innsatser
Lanseringen av Fable 5 skjer i et konkurranseklima der OpenAI, Google og Meta kontinuerlig presser grensene for hva AI-modeller kan gjøre. Anthropic posisjonerer seg tydelig i den øverste enden av markedet, med et produkt rettet mot brukere og bedrifter som trenger modeller som holder ut over tid og ved komplekse, sammensatte oppgaver.
Det er verdt å merke seg at de konkrete benchmark-tallene for Fable 5 spesifikt ennå ikke er uavhengig verifisert — Anthropics egne påstander om ytelse bør leses i lys av at selskapet selv har interesse av å presentere modellen i et godt lys. The Verge, som er kildegrunnlaget for denne artikkelen, refererer Anthropics egne uttalelser uten tredjepartsbekreftelse på publiseringstidspunktet.
Hva skjer videre?
Med Fable 5 ute i markedet er det rimelig å forvente at uavhengige benchmarks og brukerrapporter vil gi et mer nyansert bilde av modellens faktiske styrker og svakheter i løpet av de kommende ukene. Særlig vil det bli interessant å se hvordan modellen presterer på lange, agentic oppgaver der Anthropic selv mener den skiller seg mest ut.
