En PDF dumpet på Hacker News i går kveld har satt fyr på diskusjonene, og med 466 poeng og over 300 kommentarer er dette noe folk virkelig sitter opp sent for å lese. System cardet til Claude Mythos Preview er lekket — eller rettere sagt, stille publisert — og det er ganske vilt lesing.
Kort fortalt: Anthropic har bygget en modell de selv beskriver som kapabel til å "overgå alle unntatt de mest dyktige menneskene" når det gjelder å finne og utnytte programvaresårbarheter. Og nettopp fordi den er så god, planlegger de ikke å gi folk flest tilgang til den. Noensinne.
I stedet har de lansert noe de kaller Project Glasswing — et stort sikkerhetsprogram der Mythos Preview brukes defensivt, altså for å finne hull før de onde gjør det. Partnerlisten er absurd: AWS, Apple, Google, Microsoft, Cisco, NVIDIA, JPMorganChase, og en haug andre. Over 40 organisasjoner totalt.
Resultatene er det som virkelig får folk til å miste pusten. Modellen har funnet en 27 år gammel bug i OpenBSD og et 16 år gammelt sikkerhetshull i FFmpeg — hull som hadde overlevd millioner av automatiserte tester. Den klarer også å kjede sammen flere Linux-kernel-sårbarheter for å eskalere seg til full maskinkontroll på egenhånd.
Benchmarktallene understreker spranget: Mythos Preview scorer 93,9 % på SWE-bench Verified, mot 80,8 % for Claude Opus 4.6. På cybersikkerhetsspesifikke tester er gapet enda større.
Anthropics egne ord er ganske alvorlige her. De skriver at om lignende kapabiliteter sprer seg til aktører uten ansvarlig tilnærming, kan konsekvensene for økonomi, offentlig sikkerhet og nasjonal sikkerhet bli «alvorlige». Dette er grunnen til at de kjører Glasswing nå — de kaller det selv et «hastende forsøk på å sette kapabilitetene i forsvarsverk».
HN-trådene er verdt å følge. Én diskuterer selve cybersikkerhetskapabilitetene, en annen tar for seg Project Glasswing mer bredt. Stemningen er blandet — imponert, men også en del ubehag rundt det faktum at vi nå har AI-er som er for farlige til å dele, men kraftige nok til å brukes til å rescape hele sikkerhetslandskapet.
Viktig forbehold: Dette er fortsatt early signals basert på community-diskusjoner og et offentliggjort system card. Vi vet lite om hva som faktisk har blitt patchet, og koalisjonspartnerne har foreløpig ikke kommentert bredt. Men dette er definitivt noe mainstream tech-media vil plukke opp i løpet av de neste dagene.
