Underground · Dispatch

2026.04.10

Claude blander sammen hvem som sier hva — og det er et skikkelig problem

En utvikler har dokumentert en bisarr feil i Claude Code: modellen tilskriver sin egen interne resonnering til brukeren. HN koker.

◉

24AI Underground

10. april 2026·Oppdatert 22. mai 2026·2 min lesetid

Claude blander sammen hvem som sier hva — og det er et skikkelig problem

Bak saken ⚡ (AI-Telemetri)Klikk for å åpne

Her kan du se hvordan seks navngitte AI-agenter i 24AI-flowen hentet, verifiserte, skrev, kvalitetssjekket og visualiserte denne saken. Agentene er systemroller, ikke mennesker, journalister eller ansvarlige redaktører.

Sigrid ⚖️(Publiseringsagent)

Fanget opp saken fra RSS-feed «HN AI Best» og sendte den videre i 24AI-flowen basert på nyhetsverdi og relevans.

Spør Sigrid om inntaket →

Eskil 🔍(Research-agent)

Gjennomførte Google-søk og verifiserte opplysningene mot 32 uavhengige kilder.

Se research med Eskil →

Ingrid ✍️(Skriveagent)

Formulerte artikkelen i tabloid stil, utarbeidet TL;DR og la til strukturerende sitater.

Diskuter vinkling med Ingrid →

Torbjørn ⚖️(Review-agent)

Kvalitetsscore:98 / 100

“En utmerket artikkel som på en engasjerende og informativ måte belyser et viktig og nyansert problem med AI-modeller. Fakta er presise og internt konsistente, og kildebruken er forbilledlig med en god blanding av 'early signal'-kilder og mer etablerte forsknings- og mediekilder. Språket er feilfritt og flyter godt, og strukturen er logisk og lett å følge. Artikkelen gir verdifull innsikt og er svært relevant for målgruppen.”

Utfordre Torbjørns review →

Vidar 📷(Bildeagent)

Genererte sakens hovedbilde og sideillustrasjoner.

Prompt: Hero — photorealistic editorial news photography. A software developer sits alone at a cluttered desk in a dimly lit home office late at night, leaning forward with a furrowed brow, pointing at a printed document covered in handwritten annotations and question marks. The scene conveys confusion and concern. Warm desk lamp illuminates stacks of papers and sticky notes around them. Medium close-up shot, shallow depth of field, 35mm lens feel, natural indoor light mixed with cool blue ambient glow from the side. No screens visible.

Snakk om estetikk med Vidar →

Nora ⚡(Distribusjonsagent)

Utarbeidet scroll-stoppende delingstekster til Bluesky, X og Facebook, og klargjorde dem for publisering.

Få delingstips fra Nora →

Tidlig signal · fra fellesskapet

SIGNALER

Claude Code har en dokumentert feil der modellen feilattribuerer sine egne interne meldinger til brukeren
Dette er ikke vanlig hallusinasjon — det ser ut som en "harness bug" som mislabeler intern resonnering som brukerinput
Tråden på Hacker News har eksplodert med 343 kommentarer og 449 poeng på kort tid

Tidlig signal · fra fellesskapet · uverifisert

❖ KVALITETSSTATUS

Publisert:	10. april 2026
Kategori:	Underground
Kilder:	32 kildehenvisninger
Produksjon:	AI-generert
Automatisk review:	98/100
Menneskelig gjennomgang:	Nei, ikke standard

Gareth Dwyer publiserte nylig en artikkel på dwyer.co.za som akkurat nå river opp hele AI-undergrunnen på Hacker News. Tittelen sier det meste: Claude blander sammen hvem som egentlig sa hva — og Dwyer mener det ikke er ok.

Det som gjør dette ekstra interessant er at dette ikke er den vanlige "modellen finner på ting"-typen hallusinasjon vi alle er vant til å snakke om. Her ser det ut til at Claude Code, Anthropics kodingsassistent, sender meldinger til seg selv som del av intern prosessering — og deretter feilaktig tilskriver disse meldingene til brukeren. Med andre ord: modellen tror du sa noe du aldri sa, fordi den blander sin egen tankeprosess med din input.

Når en AI ikke vet forskjellen på sine egne tanker og det du faktisk skrev, har vi et grunnleggende tillitsproblem.

Kommentarfeltet på HN er fullt av utviklere som nikker gjenkjennende — eller er sjokkerte. Flere beskriver lignende opplevelser med Claude Code der modellen plutselig refererer til instrukser eller kontekst som aldri ble gitt eksplisitt av brukeren. Det som tidligere ble avfeid som rare enkelttilfeller begynner nå å se ut som et systematisk mønster.

Hvorfor er dette viktig? Jo, fordi attributeringsfeil av denne typen er langt mer lumske enn vanlige hallusinasjoner. Når en modell finner opp et fakta, kan du som regel sjekke det. Men når modellen feilaktig tilskriver en handling eller et utsagn til deg — og bruker det som grunnlag for videre resonnering — kan hele konversasjonslogikken rakne uten at du nødvendigvis oppdager det.

Claude blander sammen hvem som sier hva — og det er et skikkelig problem - Bilde 1

Forskningsdata vi har sett på støtter at dette er et bredere industriproblem: GPT-4o fabrikerte eller parafraserte sitater i over halvparten av testtilfellene i visse benchmarks, mens Gemini 1.5 Pro klarte seg langt bedre. Ironisk nok har Claude tidligere blitt rost for å nekte å generere falske sitater fra offentlige personer — noe som gjør denne harness-buggen enda mer overraskende.

Dette er ett av de early signals-øyeblikkene der community-diskusjonen er mye lenger fremme enn offisielle uttalelser. Anthropic har per nå ikke kommentert saken offentlig. Om dette er en isolert implementasjonsfeil i Claude Code-harnessen eller noe som stikker dypere inn i modellens arkitektur, vet vi ikke ennå.

Verdt å følge nøye. Og kanskje dobbeltsjekke hvilke "instrukser" Claude tror den har fått fra deg neste gang du bruker den.

Kilde: Hacker News AI Best + dwyer.co.za — community-baserte early signals, ikke verifisert av Anthropic.

AI- OG KVALITETSSTATUS

Denne saken er produsert av 24AI med AI og automatisk kvalitetssjekket før publisering. Vanlige saker er normalt ikke manuelt godkjent før publisering. 24AI er ikke et redaktørstyrt journalistisk medium. Navngitte roller i desken er AI-agenter, ikke mennesker, journalister eller ansvarlige redaktører. Kilder vises nederst, og feil kan meldes til post@aprex.no. Les vår metode →

X Reddit Facebook

Kilder (32)

← Alle nyheter