Den raske fremveksten av autonome AI-agenter — systemer som kan utføre oppgaver på egenhånd og motta instrukser fra andre AI-systemer — har fått Google DeepMind til å prioritere forskning på hva som faktisk kan gå galt når disse agentene møter hverandre i stor skala.
Agenter som styrer agenter
Ifølge MIT Technology Review er det Rohin Shah, direktør for DeepMinds AGI-sikkerhets- og justeringsarbeid, som har satt søkelyset på dette problemet. Kjernen i bekymringen er at agenter ikke bare handler på instrukser fra mennesker — de kan også motta og følge instrukser fra andre AI-agenter. Når dette skjer i millionvis av samtidige interaksjoner, oppstår scenarier som ingen enkelt aktør har full oversikt over.
Dette er ikke en fjern fremtidsdystopi. Utviklingen er allerede i gang, og farten er høy.
Når agenter begynner å gi hverandre instrukser uten menneskelig kontroll, mister vi grunnleggende oversikt over hva som faktisk skjer i systemet.

Et marked i eksplosiv vekst
Konteksten for bekymringen er et marked som vokser raskere enn nesten noe annet segment innen teknologi. Ifølge markedsdata var det globale markedet for multi-agent AI-systemer verdsatt til rundt 7,2 milliarder dollar i 2024. Prognosene peker mot en svært kraftig ekspansjon de kommende årene.
Gartner rapporterer om en oppgang på 1 445 prosent i forespørsler om multi-agent-systemer fra første kvartal 2024 til andre kvartal 2025 — et tall som illustrerer hvor raskt bedrifter beveger seg mot denne teknologien. Samme analysebyrå anslår at 70 prosent av alle AI-applikasjoner vil benytte multi-agent-arkitektur innen 2028.
Det er viktig å understreke at markedsprognoser i dette segmentet varierer betydelig mellom ulike analysebyråer, og at tall i den øverste enden av spekteret bør tolkes med forsiktighet.
Hva er det egentlig som kan gå galt?
Problemet DeepMind peker på handler ikke bare om at én agent gjør noe feil. Det handler om systemeffekter — hva skjer når feil, misforståelser eller ondsinnede instrukser forplanter seg gjennom lange kjeder av agent-til-agent-kommunikasjon?
Noen konkrete risikoscenarier som diskuteres i forskningsmiljøet:
- Prompt injection på tvers av agenter: En ondsinnet instruksjon injisert tidlig i en kjede kan forplante seg og forsterkes
- Ansvarsfraskrivelse: Når en handling er resultatet av mange agenter i serie, er det uklart hvem — eller hva — som er ansvarlig
- Uforutsigbar emergent atferd: Systemer som fungerer stabilt isolert, kan oppføre seg på uventede måter i samspill med andre systemer
Bransjen er klar over problemet — men løsningene mangler
At DeepMind velger å finansiere ekstern forskning på dette feltet, signaliserer at selskapet ikke anser egne interne ressurser som tilstrekkelige for å forstå omfanget av utfordringen. Det er et signal som bransjen som helhet bør merke seg.
McKinsey anslår at multi-agent AI-systemer kan generere mellom 450 og 650 milliarder dollar i ekstra årlig omsetning innen 2030, og at prosessene kan bli 30 til 50 prosent billigere. Incentivene for rask utrulling er med andre ord massive — mens sikkerhetsinfrastrukturen ennå ikke har tatt igjen utviklingshastigheten.
Hva gjør DeepMind nå?
Konkret innebærer DeepMinds satsing finansiering av ekstern sikkerhetsforskning rettet mot å forstå og kartlegge risikoene ved storskala agent-interaksjon. Rohin Shah og teamet hans arbeider med å identifisere hvilke typer scenarier som er mest kritiske, og å utvikle rammeverk for tryggere agent-til-agent-kommunikasjon, ifølge MIT Technology Review.
Det gjenstår å se om tempoet i sikkerhetsforskningen kan holde tritt med tempoet i kommersiell utrulling. Historien fra andre teknologirevolusjoner gir ikke alltid grunn til optimisme på det punktet.
