En diskusjonstråd på Product Hunt rundt Gemini Omni Flash begynner å tiltrekke seg oppmerksomhet i AI-undergrunnen, og signalene er verdt å merke seg FØR dette havner i mainstream tech-presse.
Google har posisjonert Omni Flash som en rask, multimodal modell som kan generere og redigere videoer via samtalebasert grensesnitt. Det høres lovende ut — og noen use cases fungerer faktisk greit. Men det er en ganske lang liste med praktiske problemer som mange brukere først møter etter at de har betalt.
Det mest konkrete problemet handler om pris versus realitet. Modellen koster ca. 0,10 dollar per sekund output, som tilsynelatende gir en 10-sekunders klipp for 1 dollar. Det stemmer teknisk sett. Men fordi kvaliteten svinger og du gjerne trenger 4–6 forsøk per brukbar klipp, er den reelle kostnaden nærmere 6 dollar per klipp du faktisk kan bruke til noe. I tillegg rapporterer brukere på billigere planer (20 dollar/mnd) at de treffer daglige tak allerede etter 3–5 videoer.
Utover prising er det tekniske svakheter som også skaper støy. Tekstrendering i videoer er dårlig — skilt, undertekster og labels degraderer kraftig. Etter tre til fire redigeringsrunder i en samtalebasert sesjon begynner karakterer og scener å miste konsistens. Og lyd er begrenset til voice-over-narrasjon; ingen bakgrunnsmusikk, ingen lydeffekter.

Verdt å nevne: research-signalene peker på at Gemini 3 Flash (en nærliggende slektning) viste 91% hallusinasjonsrate i ett benchmark. Det er en alarmerende tallstørrelse, og selv om Omni Flash er en annen variant, er det rimelig å være skeptisk til faktanøyaktigheten i output fra Flash-familien generelt.
Hva betyr dette? For det første er dette fortsatt public preview, og Google er åpent om at lengre klipp og forbedringer kommer. De har allerede doblet videogrensene for Ultra-abonnenter etter at en bug spiste for mange credits. Så det er tegn på at de lytter.
For det andre er dette et tidlig advarselssignal til alle som vurderer Omni Flash for kreative arbeidsflyter i 2026: bygg inn en solid buffer i budsjett og tidsplan. Modellen er interessant som teknologisk retning — konversasjonsbasert videoredigering er genuint spennende — men den er ikke produksjonsklar for noe som krever konsistens, tekst i bilde eller mer enn noen få klipp per dag.
Følg med. Dette er tidlige community-signaler, ikke en ferdig dom.
