Google setter ny standard for AI-video
Googles nyeste AI-modell, Gemini Omni, representerer et markant skifte i hvordan kunstig intelligens håndterer videoinnhold. Der tidligere verktøy primært tok imot tekstbeskrivelser, aksepterer Omni tekst, bilder, lyd og allerede eksisterende video som inngangsdata – og produserer nye videoer på tvers av alle disse formatene.
Den første modellen i familien, Gemini Omni Flash, ble tilgjengelig 19. mai 2026 for betalende abonnenter på Google AI Plus, Pro og Ultra via Gemini-appen og Google Flow, ifølge TechCrunch.
Redigering gjennom samtale
En av de mest fremtredende egenskapene ved Gemini Omni er det som kalles konversasjonsbasert redigering. Brukeren kan skrive inn instruksjoner på naturlig språk – for eksempel «bytt bakgrunnen til en regnskog» eller «endre vinkelen til fugleperspektiv» – og modellen gjennomfører endringen mens den opprettholder konsistens i stil og innhold gjennom hele videoen.
AI-analyseplattformen Pollo AI beskriver dette som noe kvalitativt nytt: «Det som skiller seg ut er ikke bare bedre bilder, men hvordan modellen samler generering, chat-basert redigering, remixing og kontekstuell forståelse i én arbeidsflyt. Det er det som gjør den verdifull for skapere,» heter det i deres vurdering.
Gemini Omni føles mindre som en liten oppgradering og mer som et seriøst steg mot nativ multimodal AI-video
Fysikk og verdenskunnskap
Google hevder at Omni genererer video med mer realistisk fysikk enn tidligere modeller, med forståelse for konsepter som tyngdekraft, kinetisk energi og væskedynamikk. I tillegg skal modellen trekke på Geminis eksisterende faktabase for å sikre historisk, vitenskapelig og kulturell nøyaktighet i videoinnholdet.
Det er foreløpig ikke uavhengig verifisert i hvilken grad disse påstandene holder i praksis, og brukererfaringer fra bredere publikt tilgang er ennå begrenset.
Googles DeepMind-sjef Demis Hassabis har karakterisert prosjektet som et steg mot kunstig generell intelligens (AGI), en betegnelse som bør leses med en viss kildekritisk distanse gitt den strategiske kommunikasjonskonteksten.
Sora er borte – Omni overtar rommet
Timingen er påfallende. OpenAIs video-AI Sora ble offisielt lagt ned 26. april 2026, bare tre uker før Googles lansering. API-et for Sora er planlagt avviklet 24. september 2026. Den direkte konkurransen er dermed redusert, selv om aktører som Luma AIs Dream Machine fortsatt er i markedet.
Det gjør Googles posisjon sterkere, særlig med integrasjonen mot YouTube Shorts og YouTube Create – plattformer med massiv brukermasse – som er ventet å bli tilgjengelig for gratisbrukere i løpet av samme uke som lanseringen.
Digitale avatarer og ansvarlighetsspørsmål
Omni inkluderer også funksjonalitet for å lage digitale avatarer basert på brukernes eget utseende og stemme. Google opplyser at denne funksjonen fortsatt gjennomgår ansvarlig testing og ikke er fullt tilgjengelig ennå.
Teknikmagasinet PCMag peker på en bredere utfordring knyttet til slike verktøy: jo mer realistisk AI-generert video blir, desto vanskeligere blir det å skille ekte innhold fra syntetisk. Googles bruk av SynthID-vannmerker er et tiltak, men er avhengig av at systemer og plattformer faktisk leser og vektlegger slike metadata.
En «Omni Pro»-modell med høyere kapasitet er varslet av Google, men selskapet har ikke gitt konkrete detaljer om funksjonalitet eller lansering.
