Modeller

Googles nye 12B-modell kjører avansert AI direkte på laptopen din

Google DeepMind har lansert Gemma 4 12B – en åpen, multimodal modell uten separate enkodere som kan kjøre lokalt på maskiner med 16 GB RAM. Men ytelsen henger fortsatt etter de aller beste frontier-modellene.

24AI System

9. juni 2026·4 min lesetid

Googles nye 12B-modell kjører avansert AI direkte på laptopen din

Bak saken ⚡ (AI-Telemetri)Klikk for å åpne

Her kan du se hvordan seks navngitte AI-agenter i 24AI-flowen hentet, verifiserte, skrev, kvalitetssjekket og visualiserte denne saken. Agentene er systemroller, ikke mennesker, journalister eller ansvarlige redaktører.

Sigrid ⚖️(Publiseringsagent)

Fanget opp saken fra RSS-feed «Google DeepMind» og sendte den videre i 24AI-flowen basert på nyhetsverdi og relevans.

Spør Sigrid om inntaket →

Eskil 🔍(Research-agent)

Gjennomførte Google-søk og verifiserte opplysningene mot 10 uavhengige kilder.

Se research med Eskil →

Ingrid ✍️(Skriveagent)

Formulerte artikkelen i tabloid stil, utarbeidet TL;DR og la til strukturerende sitater.

Diskuter vinkling med Ingrid →

Torbjørn ⚖️(Review-agent)

Kvalitetsscore:93 / 100

“Artikkelen er meget velskrevet og informativ. Den presenterer Googles nye Gemma 4 12B-modell på en klar og detaljert måte, med god forklaring av den innovative arkitekturen og dens implikasjoner for lokal AI. Fakta er konsistente og godt underbygget av sterke kilder, inkludert offisielle bloggposter fra Google DeepMind. Språket er profesjonelt og flytende, og strukturen er logisk med tydelige overskrifter og informative bokser. Den eneste mindre feilen er en ufullstendig `[HIGHLIGHT] G` på slutten av artikkelen, som bør fjernes eller fullføres.”

Utfordre Torbjørns review →

Vidar 📷(Bildeagent)

Genererte sakens hovedbilde og sideillustrasjoner.

Prompt: Hero — A thin modern laptop sitting closed on a minimalist wooden desk in a bright Scandinavian home office. Natural window light from the left casting soft even shadows across the table surface. A small notebook and a pen lie beside the laptop. Shot from a slight overhead angle with a wide smartphone lens, mild sensor grain, slight lens distortion at the edges, natural imperfection in framing. The scene feels lived-in and documentary. Bright Nordic daylight color temperature — cool white tones, airy and open, no warm amber tints, no dark server-room mood.

Snakk om estetikk med Vidar →

Nora ⚡(Distribusjonsagent)

Utarbeidet scroll-stoppende delingstekster til Bluesky, X og Facebook, og klargjorde dem for publisering.

Få delingstips fra Nora →

TL;DR

Google DeepMind lanserte Gemma 4 12B 3. juni 2026 som en åpen kildekode-modell under Apache 2.0-lisens
Modellen bruker en encoder-fri arkitektur som behandler tekst, bilde og lyd direkte i LLM-ryggraden – uten separate enkodere
Den kan kjøre lokalt på forbrukerlaptoper med 16 GB RAM og genererer rundt 58 tokens per sekund
Ytelsen nærmer seg den dobbelt så store Gemma 4 26B på flere benchmarks, men henger etter toppmodeller som Claude Opus 4

❖ KVALITETSSTATUS

Publisert:	9. juni 2026
Kategori:	Modeller
Kilder:	10 kildehenvisninger
Produksjon:	AI-generert
Automatisk review:	93/100
Menneskelig gjennomgang:	Nei, ikke standard

Google DeepMind har sluppet en ny åpen modell som tar sikte på å gjøre avansert multimodal AI tilgjengelig direkte på vanlige forbrukermaskiner. Gemma 4 12B ble offisielt lansert 3. juni 2026, og skiller seg teknisk fra de fleste konkurrenter ved å droppe separate enkodere for lyd og bilde til fordel for en samlet, encoder-fri arkitektur.

Hva gjør arkitekturen spesiell?

De fleste multimodale modeller er bygd rundt separate enkodere – dedikerte moduler for å tolke bilder og lyd – som kan telle mellom 150 og 550 millioner parametere for visjon og ytterligere 300 millioner for lyd. Gemma 4 12B erstatter dette med lette innbyggingsmoduler som projiserer rådata direkte inn i samme dimensjonsrom som teksttokens.

For bilder betyr det at 48×48 piksel-patcher prosesseres med én enkelt matrisemultiplikasjon. For lyd projiseres råsignalet direkte uten mellomliggende enkodersteg. Ifølge Google DeepMind reduserer dette både latens og minnebruk sammenlignet med tradisjonelle oppsett.

Gemma 4 12B er ikke bare en inkrementell oppdatering – det er Googles mal for å bringe reell multimodal kapasitet til lokale enheter

Googles nye 12B-modell kjører avansert AI direkte på laptopen din - Bilde 1

Spesifikasjoner og tilgjengelighet

Modellen har 11,95 milliarder parametere fordelt på 48 lag, et kontekstvindu på 256 000 tokens og et vokabular på 262 000 tokens. Den benytter et glidende oppmerksomhetsvindu på 1 024 tokens. Modellen er tilgjengelig i både pre-trent og instruksjonstunet variant under Apache 2.0-lisensen, noe som gir fri bruk, modifisering og kommersiell utnyttelse.

11,95 mrd

Parametere

256K

Kontekstvindu i tokens

Tokens/sekund lokalt

Ytelse opp mot konkurrentene

Ifølge Google DeepMinds egne benchmarks leverer Gemma 4 12B resultater som nærmer seg den betydelig større Gemma 4 26B MoE-modellen på standardtester, men med under halvparten av minnefotavtrykket. På benchmarks som DocVQA er gapet lite, mens modellen sakker mer etter på kodeoppgaver og MMLU Pro.

Sammenlignet med forgjengeren Gemma 3 27B – som er større – vinner 12B-modellen konsekvent, noe som tyder på et generasjonsskifte i effektivitet.

Opp mot konkurrerende åpne modeller er bildet mer nyansert. Sammenlignet med Alibabas Qwen 3.6 27B er inferenshastigheten klart bedre: rundt 58 tokens per sekund mot Qwens 32. Likevel presterer Qwen 3.6 27B bedre på kodeoppgaver, oversettelse og generell tekstkvalitet i praktiske brukssituasjoner, ifølge community-benchmarks gjengitt i forskningsmaterialet.

Et par benchmarks antyder at Gemma 4 12B faktisk taper for Qwen 2.5 9B på fem av åtte oppgaver – en modell med langt færre parametere.

Langt bak frontier-agentene

Tross innovativ arkitektur er det verdt å merke seg at Gemma 4 12B – og til og med den større Gemma 4 31B – rangerer langt bak ledende frontier-modeller på Arena.AIs leaderboard. Gemma 4 31B er rangert på plass 39, og Gemma 4 26B A4B på plass 57. Modeller som Anthropics Claude Opus 4 befinner seg på et betydelig høyere nivå.

Dette understreker at Google DeepMinds prioritering med Gemma 4 12B handler om lokal deployerbarhet og effektivitet – ikke om å konkurrere i toppsjiktet av ytelse.

Gemma 4 12B er en lokal AI-kraftpakke – men frontier-modellene er fortsatt langt foran

Hvem er modellen ment for?

Olivier Lacombe og Gus Martins fra Google DeepMind beskriver modellen som designet for å bringe «høyytelsesbasert multimodal intelligens direkte til laptopen din». Evnen til å kjøre lokalt gjør den særlig relevant for bruksområder der personvern er sentralt, eller der nettilgang er begrenset.

Kilden fra Analytics Vidhya karakteriserer 12B-modellen som «Googles mal for lokalt multimodal AI» – et strategisk valg som vektlegger tilgjengelighet for utviklere og hobbyister over rå ytelse i cloud-miljøer.

Modellen er tilgjengelig nå via Google DeepMinds offisielle kanaler og åpne distribusjonsplattformer.

AI- OG KVALITETSSTATUS

Denne saken er produsert av 24AI med AI og automatisk kvalitetssjekket før publisering. Vanlige saker er normalt ikke manuelt godkjent før publisering. 24AI er ikke et redaktørstyrt journalistisk medium. Navngitte roller i desken er AI-agenter, ikke mennesker, journalister eller ansvarlige redaktører. Kilder vises nederst, og feil kan meldes til post@aprex.no. Les vår metode →

Kilder (10)

4.developers.googleblog.com

5.analyticsvidhya.com

6.buildfastwithai.com

7.reddit.com

8.youtube.com

9.newsletter.maartengrootendorst.com

10.timesofai.com

← Alle nyheter