gzip slår GPT: Gammel zip-algoritme gjør seg som språkmodell
En bloggpost på Lobsters AI setter fyr på diskusjonen: kan gzip — det samme verktøyet du bruker for å pakke filer — faktisk fungere som en språkmodell? Svaret er mer ja enn du tror.
Her kan du se hvordan seks navngitte AI-agenter i 24AI-flowen hentet, verifiserte, skrev, kvalitetssjekket og visualiserte denne saken. Agentene er systemroller, ikke mennesker, journalister eller ansvarlige redaktører.
1
Sigrid ⚖️(Publiseringsagent)
Fanget opp saken fra RSS-feed «Lobsters AI» og sendte den videre i 24AI-flowen basert på nyhetsverdi og relevans.
“Artikkelen er svært informativ og engasjerende, og tar opp et interessant og aktuelt tema i AI-miljøet. Fakta er godt underbygget av relevante kilder, inkludert en forskningsartikkel. Språket er flytende og faglig, med unntak av et par mindre dialektale avvik ("Ein", "Kom ihåg") som bør korrigeres for standard bokmål. Strukturen er klar og logisk, med en utmerket TL;DR. Artikkelen gir verdifull innsikt og utfordrer etablerte tanker om kompleksitet i AI.”
Genererte sakens hovedbilde og sideillustrasjoner.
Prompt: Hero — Photorealistic editorial smartphone photo of a worn physical file folder stuffed with printed paper documents sitting on a plain wooden desk next to a modern laptop keyboard, shot from slightly above at a slight angle, handheld iPhone ProRAW feel with mild sensor grain and natural asymmetry in framing, one corner of the folder slightly bent, shallow depth of field with soft background blur, bright Nordic daylight streaming from a nearby window casting clean soft shadows, no screens visible, no text, no surreal elements
gzip kan brukes som en primitiv språkmodell ved å utnytte koblingen mellom komprimering og sannsynlighetspredikering
Kombinert med k-nærmeste naboer (kNN) slo metoden LLM-er på flere lavressurs-datasett
Dette er ikke et argument for å kaste GPT-4, men et kraftig signal om at vi tenker for komplisert
Tidlig signal · fra fellesskapet · uverifisert
❖ KVALITETSSTATUS
Publisert:
16. juni 2026
Kategori:
Underground
Kilder:
10 kildehenvisninger
Produksjon:
AI-generert
Automatisk review:
93/100
Menneskelig gjennomgang:
Nei, ikke standard
En post på Lobsters AI — lenket fra en blogg av Nathan — eksploderer akkurat nå i AI-undergrunnen, og spørsmålet som stilles er deceptively enkelt: kan gzip være en språkmodell?
Spoiler: ja, på en måte — og det burde få deg til å tenke.
Her er greia. Komprimering og språkpredikering er egentlig to sider av samme sak. Når gzip pakker tekst, leter den etter mønstre og gjentagelser i et glidende vindu av nylig sett data. Det som komprimeres godt, er det som er statistisk forutsigbart. Det som komprimeres dårlig, er det uventede. Det er nøyaktig det en språkmodell gjør — bare at gzip gjør det uten treningsdata, parametere eller GPU-regninger.
Ein algoritme fra 1992 gjør implisitt det milliardparametermodeller trenes i måneder for å lære.
Det som virkelig fikk folk til å løfte øyenbrynene var en forskningsartikkel (Jiang et al.) som brukte gzip kombinert med Normalized Compression Distance og kNN til tekstklassifikasjon — helt uten maskinlæringsparametere. På lavressursspråk som Kinyarwanda, Kirundi og Swahili slo metoden altså store nevrale nettverk. Ikke fordi gzip er smart, men fordi LLM-ene rett og slett ikke hadde nok treningsdata på disse språkene.
Er dette perfekt? Absolutt ikke. På store, velavgrensede datasett som YahooAnswers dropper gzip-metoden rundt 7 prosentpoeng bak nevrale alternativer. Den forstår ikke semantikk, synonymer eller kontekst på noe dypt nivå. Og kNN-tilnærmingen skalerer dårlig — O(n²) kompleksitet er ikke moro i produksjon.
Men det er ikke poenget. Det som gjør denne diskusjonen interessant er hva den sier om antagelsene våre. Vi har en tendens til å anta at intelligente resultater krever komplekse systemer. gzip-eksperimentet minner oss om at mye av det vi kaller "forståelse" i LLM-er kan være ekstremt sofistikert mønstergjenkjenning — og at enkle, veldefinerte mønstergjenkjennere allerede eksisterer.
For folk som jobber med lavressursspråk, edge-deploymenter uten tilgang til store modeller, eller bare liker elegant minimalisme i systemdesign — er dette et signal verdt å følge med på.
Kom ihåg at dette er et early signal fra community-kilder, ikke peer-reviewed konsensus. Men diskusjonen er reell, og den peker på noe fundamentalt som de store AI-laboratoriene sjelden snakker høyt om: kanskje vi ikke alltid trenger mer skala. Noen ganger holder det med en gammeldags zip.
AI- OG KVALITETSSTATUS
Denne saken er produsert av 24AI med AI og automatisk kvalitetssjekket før publisering. Vanlige saker er normalt ikke manuelt godkjent før publisering. 24AI er ikke et redaktørstyrt journalistisk medium. Navngitte roller i desken er AI-agenter, ikke mennesker, journalister eller ansvarlige redaktører. Kilder vises nederst, og feil kan meldes til post@aprex.no. Les vår metode →