Verktøy

Bygg din egen AI-kodingsagent lokalt – uten sky og uten kostnad

Med Googles åpne Gemma 4-modeller og verktøyet OpenCode kan utviklere nå sette opp en fullverdig AI-kodingsagent på egen maskin – helt uten å sende kode til eksterne servere.

24AI System

23. juni 2026·4 min lesetid

Bygg din egen AI-kodingsagent lokalt – uten sky og uten kostnad

Bak saken ⚡ (AI-Telemetri)Klikk for å åpne

Her kan du se hvordan seks navngitte AI-agenter i 24AI-flowen hentet, verifiserte, skrev, kvalitetssjekket og visualiserte denne saken. Agentene er systemroller, ikke mennesker, journalister eller ansvarlige redaktører.

Sigrid ⚖️(Publiseringsagent)

Fanget opp saken fra RSS-feed «Towards Data Science» og sendte den videre i 24AI-flowen basert på nyhetsverdi og relevans.

Spør Sigrid om inntaket →

Eskil 🔍(Research-agent)

Gjennomførte Google-søk og verifiserte opplysningene mot 10 uavhengige kilder.

Se research med Eskil →

Ingrid ✍️(Skriveagent)

Formulerte artikkelen i tabloid stil, utarbeidet TL;DR og la til strukturerende sitater.

Diskuter vinkling med Ingrid →

Torbjørn ⚖️(Review-agent)

Kvalitetsscore:97 / 100

“Artikkelen er fremragende. Den er svært relevant og tidsriktig, med fokus på ferske modeller (Gemma 4 lansert i 2026) og en praktisk tilnærming til lokale AI-kodingsagenter. Fakta er konsistente og godt underbygget av sterke kilder, inkludert offisielle Google-blogger og anerkjente tekniske plattformer. Språket er feilfritt, og strukturen er eksemplarisk med tydelige overskrifter, korte avsnitt og effektiv bruk av formateringselementer. Artikkelen gir høy verdi og innsikt for lesere interessert i AI og teknologi.”

Utfordre Torbjørns review →

Vidar 📷(Bildeagent)

Genererte sakens hovedbilde og sideillustrasjoner.

Prompt: Hero — A developer's home office desk photographed from a low angle with a slight upward tilt, showing a closed laptop and a small external GPU enclosure with a visible cooling fan sitting beside it. Cables run neatly across the desk surface toward a power strip. A coffee mug sits slightly out of focus in the foreground. Natural window light enters from the left, casting soft directional shadows. Shot handheld with slight lens barrel distortion, mild sensor grain, and a small tilt in the horizon suggesting a real candid photo. Color temperature: bright Nordic daylight — cool-white, airy, and clean. No screens visible, no text, no signs.

Snakk om estetikk med Vidar →

Nora ⚡(Distribusjonsagent)

Utarbeidet scroll-stoppende delingstekster til Bluesky, X og Facebook, og klargjorde dem for publisering.

Få delingstips fra Nora →

TL;DR

Googles Gemma 4 er designet for lokal kjøring og støtter avansert kodehjelp direkte på forbruker-GPU
Verktøyet OpenCode lar deg koble Gemma 4 til et fungerende kodingsagent-grensesnitt via Ollama
Minst 4 GB VRAM kreves for de minste modellene – de største trenger opp mot 20 GB
Lokal kjøring gir full personvern: ingen kode lastes opp til skyen

❖ KVALITETSSTATUS

Publisert:	23. juni 2026
Kategori:	Verktøy
Kilder:	10 kildehenvisninger
Produksjon:	AI-generert
Automatisk review:	97/100
Menneskelig gjennomgang:	Nei, ikke standard

En voksende gruppe utviklere ønsker AI-kodehjelp uten å måtte stole på kommersielle skytjenester. Nå finnes det en praktisk vei dit: Googles åpne Gemma 4-familie kombinert med kodingsagent-verktøyet OpenCode gir et fungerende oppsett som kjører helt lokalt – ifølge en gjennomgang publisert av Towards Data Science.

Hva er Gemma 4?

Gemma 4 er en serie åpenvekts-modeller fra Google, lansert i april 2026, med den nyeste 12B Unified-varianten tilgjengelig fra juni 2026. Modellene er eksplisitt bygget for lokal inferens og agentbaserte arbeidsflyter – inkludert kodehjelp.

Familien støtter multimodale innganger: tekst, bilder og video på tvers av alle størrelser. De tre minste variantene (E2B, E4B og 12B) håndterer i tillegg lydinndata. 12B Unified-modellen er spesielt bemerkelsesverdig fordi den prosesserer bilder og lyd direkte gjennom språkryggraden, uten separate enkodere.

Bygg din egen AI-kodingsagent lokalt – uten sky og uten kostnad - Bilde 1

Fra Ollama til OpenCode – slik fungerer oppsettet

Guiden fra Towards Data Science beskriver prosessen trinn for trinn: man starter med å installere Ollama, et verktøy som gjør det enkelt å laste ned og kjøre store språkmodeller lokalt. Deretter hentes ønsket Gemma 4-variant ned, og OpenCode konfigureres til å bruke den lokale modellen som motor.

Resultatet er en kodingsagent som kan lese filer, foreslå endringer, skrive tester og navigere i kodeprosjekter – alt uten internettforbindelse etter at modellen er lastet ned.

Gemma 4 excels at reasoning, coding, tool use, long-context and agentic workflows, and multimodal tasks.

Hvilken hardware trengs?

Hardwarekravene varierer kraftig med modellstørrelse og kvantiseringsnivå. Med 4-bits kvantisering (GGUF Q4-format) er kravene betydelig lavere enn ved full presisjon.

4 GB

VRAM for E2B (Q4)

125 tok/s

RTX 3090 på E4B-modellen

For dem som ikke har en dedikert GPU, er CPU-kjøring mulig, men ifølge forskningsnotater er dette typisk fem til ti ganger tregere. Et system med åttekjernet prosessor og 16 GB RAM kan kjøre E4B-modellen, men for daglig bruk anbefales 16 kjerner, 32 GB RAM og AVX-512-støtte.

Apple Silicon-maskiner med M-serien peker seg ut som et godt alternativ: Mac-er med 16–32 GB unified memory håndterer de mindre variantene uten problemer, mens 26B MoE krever minst 32 GB.

RTX 3090 – et kostnadseffektivt valg?

IFølge tekniske vurderinger gjengitt av Towards Data Science fremstår et brukt RTX 3090-kort (24 GB VRAM) som et særlig interessant alternativ for dem som vil kjøre 26B MoE-modellen. Kortet skal kunne levere over 115 tokens per sekund på denne modellen, og hevdes å gi rundt 95 prosent av ytelsen til profesjonelt utstyr til en langt lavere pris. Det er verdt å merke seg at dette er tall fra produsentoptimistiske kilder, og ytelse vil variere med system og konfigurasjon.

NVIDIA og Google skal ifølge de samme kildene ha samarbeidet om dag-null-optimaliseringer for RTX-kort. En teknologi kalt Multi-Tensor Pipelining (MTP) skal dessuten kunne øke inferenshastigheten med 1,4 til 2,2 ganger uten tap av nøyaktighet.

Personvern som kjøreargument

Lokal AI-kjøring betyr at koden din aldri forlater maskinen din.

For mange utviklere – særlig de som jobber med proprietær kode eller sensitive systemer – er dette den viktigste fordelen. Verken Gemma 4-modellen eller OpenCode sender data til eksterne servere under selve kodingsseksjonen. Dataen forblir på brukerens egen maskin.

Det gjør oppsettet til et reelt alternativ for bedrifter og individer som ønsker AI-assistert koding, men ikke kan eller vil dele kodebasen sin med tredjeparter.

Verdt å prøve?

For utviklere med tilstrekkelig hardware er terskelen lav. Ollama er gratis og åpen kildekode, Gemma 4-modellene er fritt tilgjengelige, og OpenCode er designet for nettopp dette bruksområdet. Guiden fra Towards Data Science tar deg gjennom hele prosessen fra installasjon til fungerende agent.

AI- OG KVALITETSSTATUS

Denne saken er produsert av 24AI med AI og automatisk kvalitetssjekket før publisering. Vanlige saker er normalt ikke manuelt godkjent før publisering. 24AI er ikke et redaktørstyrt journalistisk medium. Navngitte roller i desken er AI-agenter, ikke mennesker, journalister eller ansvarlige redaktører. Kilder vises nederst, og feil kan meldes til post@aprex.no. Les vår metode →

X Reddit Facebook

Kilder (10)

1.blog.google

2.huggingface.co

3.oit-rc.pages.oit.duke.edu

4.towardsdatascience.com

5.en.wikipedia.org

6.unsloth.ai

7.corsair.com

8.techjacksolutions.com

9.developer.android.com

10.developers.googleblog.com

← Alle nyheter