Et medisinsk AI-system fra Google har klart å matche erfarne primærleger i håndtering av komplekse sykdomsbilder. Det viser ny forskning publisert i det anerkjente vitenskapelige tidsskriftet Nature. Men bak de imponerende tallene skjuler det seg betydelige forbehold som setter resultatene i et annet lys.

Hva er AMIE?

AMIE – forkortelse for Articulate Medical Intelligence Explorer – er et konversasjonsbasert AI-system utviklet av Google, bygget på selskapets Gemini-plattform. Systemet er laget for å simulere legekonsultasjoner gjennom tekstbasert dialog, stille oppfølgingsspørsmål og formulere behandlingsforslag.

Ifølge studien omtalt av Google AI Blog, klarte AMIE å matche primærleger innen fem medisinske spesialiteter i simulerte konsultasjoner. Det beskrives som et gjennombrudd for samtale-AI i medisin.

Googles medisinske AI matcher leger – men bare i simulerte tester - Bilde 1

Simulerte pasienter – ikke ekte

Den viktigste svakheten ved studien er at den ikke involverte ett eneste ekte menneske som pasient. Forsøkene ble gjennomført med enten AI-baserte pasientagenter eller skuespillere med detaljerte manus, ifølge den uavhengige forskningsgjennomgangen av studien.

Eksperter påpeker at tekstbaserte konsultasjoner ikke fanger opp det som faktisk skjer i en legeundersøkelse: kroppsspråk, ikke-verbale signaler, fysisk undersøkelse og den sosiale og kulturelle konteksten rundt en pasient. Alt dette er sentralt for god diagnostikk.

Legene ble satt opp til å tape – de jobbet etter retningslinjer de ikke bruker til daglig, og møtte scenarier konstruert med «rene, riktige svar».

I tillegg trekkes det frem at legene som deltok – rekruttert fra Canada og India – ble vurdert opp mot britiske kliniske retningslinjer de ikke nødvendigvis bruker i sin hverdag. Dette, kombinert med at de kun kommuniserte via tekst, kan ha gitt AI-en en strukturell fordel som ikke reflekterer reelle kliniske forhold.

Feil og manglende transparens

Til tross for sterke resultater i simulerte scenarier, ble det funnet potensielle resonnementsfeil i AMIEs behandlingsforslag. Eksperter advarer om at AI-systemer kan presentere feilaktige anbefalinger med høy grad av selvsikkerhet – uten at brukeren nødvendigvis oppdager det.

Et annet vesentlig poeng: AMIE er ikke åpen kildekode. Det betyr at uavhengige forskere ikke kan etterprøve eller verifisere systemets indre logikk, noe som er problematisk i en sektor der transparens er avgjørende.

Det er også verdt å merke seg at en tidligere studie med ekte pasienter viste at menneskelige leger produserte mer praktiske og kostnadseffektive behandlingsplaner enn AMIE. Denne studien ble ikke adressert i den nye Nature-artikkelen.

En studie med ekte pasienter ga et annet resultat – menneskelige leger vant.

Ekspertene er enige: ikke klar for klinikken

Den brede faglige konsensusen er klar: AMIE er ikke klar til å brukes selvstendig på ekte pasienter. Det som trengs, er prospektive studier med reelle kliniske omgivelser før man kan si noe sikkert om sikkerhet, effekt og klinisk nytte.

Ekspertene ser for seg at AI i medisin bør fungere som en «betrodd klinisk assistent» – et verktøy som støtter helsepersonell med analyse og informasjonsbehandling, mens den endelige beslutningen forblir hos menneskene. Klinisk skjønn, kommunikasjon med pasienten og håndtering av usikkerhet er oppgaver som ikke kan automatiseres bort.

AMIE representerer utvilsomt et teknologisk fremskritt innen medisinsk AI. Men veien fra kontrollerte simuleringer til trygg klinisk praksis er lengre enn studiens overskrifter kan gi inntrykk av.