Det finnes ingen AI-agent som gjør seg selv smartere. Det er en løgn industrien selger deg pakket inn i buzzwords. Hermes Agent fra Nous Research er noe langt mer interessant — og langt mer ærlig: det er en agent som blir raskere ved å huske hva som fungerte sist. Det er ikke magi. Det er arkitektur.

Fra nullpunkt til 60 000 stjerner på fire måneder

Nous Research slapp Hermes Agent på GitHub 25. februar 2026 under MIT-lisens. Prosjektet vokste eksploderende — fra 42 000 stjerner i april til konservativt estimerte 60 000+ i dag, ifølge data fra cognio.so, nxcode.io og innobu.com. Koden er 93,8% Python og kjører lokalt, i skyen eller på europeisk infrastruktur.

To milepæler har definert prosjektet hittil:

> v0.8.0 (8. april 2026): Første produksjonsrelease med 209 merged PRs, Google AI Studio-integrasjon, MCP OAuth 2.1 med PKCE og den første versjonen av GEPA.

> v0.10.0 (16. april 2026): 118 innebygde ferdigheter, tre-lags minnearkitektur, seks meldingsintegrasjoner og en lukket læringssløyfe.


Hermes Agent lærer av egne feil og blir 40% raskere — men kall det ikke selvforbedring - Bilde 1

FAKTABOKS: Hva er Hermes Agent?

EgenskapDetaljer
UtviklerNous Research
Lansert25. februar 2026
LisensMIT (åpen kildekode)
SpråkPython (93,8%)
GitHub-stjerner60 000+
Støttede modeller200+ via OpenRouter
Minste hosting€5/mnd (1 vCPU, 1 GB RAM)
Team-hosting~€15/mnd (2 vCPU, 4 GB RAM)
API-kostnad per oppgave~$0,30 med budsjettmodeller
TelemetriNull


GEPA: Algoritmen ingen snakker ærlig om

Her er kjernen som alle tar feil av. GEPA — Genetic-Pareto Evolution — ble akseptert som Oral Presentation på ICLR 2026, noe som betyr at fagfellevurderte AI-forskere mener den er verdt å høre på (innobu.com, petronellatech.com). Det er ikke markedsføring. Det er akademisk validering.

Men hva gjør den faktisk?

GEPA bruker en språkmodell til å lese gjennom fullstendige kjøringsspor — hvert steg agenten tok, hver feilmelding, hvert profileringspunkt og hver resonneringskjede. Basert på dette foreslår den målrettede forbedringer i promptene. Ikke via en enkel belønningsfunksjon som kollapser alt til én skalar, slik tradisjonell forsterkningslæring gjør. I stedet bevarer den flere mål simultant: hastighet, pålitelighet, ressursbruk.

Resultatet: 40% raskere på gjentatte oppgaver i samme domene når agenten har bygget 20 eller flere selvgenererte ferdigheter (Nous Research).

> «40% raskere er ikke det samme som 40% smartere. GEPA optimerer for effektivitet, ikke intelligens. Den samme grunnmodellen gir svarene — den bare finner dem raskere.»

> — innobu.com, april 2026

Dette er kritisk å forstå. Hermes Agent med GEPA er som en erfaren kirurg versus en nybegynner: begge har samme utdanning, men den erfarne vet hvilke verktøy hun trenger uten å lete. Selve fagkunnskapen er identisk.


Firetrinns læringssløyfen — slik fungerer det faktisk

1. Execute

Agenten fullfører oppgaver ved hjelp av 40+ innebygde verktøy — fra kodesøk og filmanipulasjon til API-kall og nettlesing.

2. Evaluate

Resultatet vurderes via eksplisitt feedback (du sier «det var bra» eller «det var feil») og implisitte akseptsignaler (fullføring uten korreksjon, vellykket kjøring av kode).

3. Abstract

Vellykkede mønstre konverteres til gjenbrukbare skill-dokumenter lagret som Markdown-filer i ~/.hermes/skills/. Dette er agentens langtidshukommelse.

4. Refine

Når en lignende oppgave dukker opp igjen, henter agenten frem relevante skills og forbedrer dem basert på ny erfaring.


NØKKELTALL

118

Innebygde ferdigheter i v0.10.0

~10ms

Søketid via FTS5 fulltekstsøk over 10 000+ skills

7 dager

The Curators automatiske oppryddingssyklus

200+

Støttede modeller via OpenRouter


Tre-lags minnearkitektur: Mer enn bare kontekstvindu

De fleste AI-agenter lever og dør i kontekstvinduet. Hermes Agent er designet annerledes med tre distinkte lag:

Korttidsminne: Standard sesjonskontekst for det du jobber med akkurat nå.

Persistent langtidsminne: En SQLite-database med FTS5 fulltekstsøk som kan finne relevante erfaringer på rundt 10 millisekunder selv over 10 000 lagrede skills. Det er raskere enn de fleste mennesker snur seg.

Proseduralt ferdighetsminne: LLM-genererte sammendrag av vellykkede arbeidsflyter, lagret strukturert og tilgjengelig for fremtidige oppgaver.

The Curator rydder mens du sover

Fra versjon 0.12 introduserte Nous Research The Curator — en bakgrunnsprosess som gjennomgår hele ferdighetsbiblioteket på en rullende 7-dagers syklus. Den konsoliderer overlappende skills som har blitt duplisert, arkiverer entries som ikke lenger er relevante og forbedrer beskrivelsen av aktive skills basert på nyere bruk.

Dette er viktig fordi ukontrollert skill-akkumulering er et reelt problem. Uten vedlikehold ville biblioteket vokse seg uhåndterlig og søkekvaliteten forringes. The Curator er løsningen ingen snakker om, men alle trenger.


Modell-agnostisisme: Kjør det du vil

Hermes Agent låser deg ikke til én leverandør. Via OpenRouter støttes over 200 modeller. Du kan bruke:

  • Kommersielle: OpenAI, Anthropic Claude, Google Gemini
  • Kinesiske alternativer: DeepSeek, Qwen, Xiaomi MiMo, z.ai GLM, Kimi Moonshot, MiniMax
  • Lokale modeller: Via Ollama på egen maskinvare
  • Nous egne modeller: Via Nous Portal

Og du kan bytte modell midt i en sesjon uten å starte på nytt. I praksis betyr det at du kan starte en analyse med en rask budsjettmodell, bytte til Claude eller GPT for de komplekse resonneringstrinnene, og gå tilbake til en lokal modell for formatering — alt i én arbeidsflyt.


EU AI Act: Løpende klokke

Fristen nærmer seg. 2. august 2026 trer de generelle forpliktelsene under EU AI Act i kraft. For norske og europeiske virksomheter som vurderer Hermes Agent er situasjonen slik:

Det som taler for: Hermes Agent kan self-hostes på europeisk infrastruktur, har null telemetri og mapper naturlig til GDPR-prinsippet om databehandling lokalt. Prosjektet er åpen kildekode, så du kan inspisere alt.

Det som kreves: Audit logging, transparensdokumentasjon og gjennomgang av skill-biblioteket (skill vetting) for AI Act-samsvar. Microsoft Agent Governance Toolkit (lansert 2. april 2026, MIT-lisens) gir konkrete compliance-mønstre som kan brukes direkte.

Konklusjon: Hermes Agent er ikke ferdig pakket for EU AI Act out of the box. Det krever arbeid. Men grunnlaget er bedre enn hos mange proprietære alternativer.


TIDSLINJE: Hermes Agent fra null til produksjon

25. februar 2026 — Lansert på GitHub under MIT-lisens

8. april 2026 — v0.8.0: Første produksjonsrelease, GEPA introdusert, Google AI Studio-integrasjon

16. april 2026 — v0.10.0: 118 skills, tre-lags minne, lukket læringssløyfe

v0.12+ — The Curator: automatisk vedlikehold av ferdighetsbibliotek

2. august 2026 — EU AI Act generelle forpliktelser trer i kraft


Begrensninger du ikke må glemme

Her er det mange som snubler. Fordi Hermes Agent er imponerende på papir, glemmer folk at det er et v0.x-prosjekt:

  • Dokumentasjonen er ufullstendig. Du vil møte vegger der det ikke finnes gode svar.
  • API-stabilitet er ikke garantert mellom minor-releaser. Kode som fungerer i v0.10 kan kreve endringer i v0.12.
  • Ikke klar for kritisk produksjon — ERP-systemer, kundedata eller livskritiske arbeidsflyter bør holde seg unna inntil videre.
  • Ungt community betyr kortere svartider på GitHub Issues og færre Stack Overflow-svar.

For pilotprosjekter innen utviklerproduktivitet, research-assistanse og rutineautomasjon er risikoprofilen rimelig. For alt annet: vent.


BOTTOM LINE

Hermes Agent er det mest lovende åpne AI-agentprosjektet i 2026, og GEPA-mekanismen — fagfellevurdert og Oral-akseptert på ICLR — gir den akademisk troverdighet de fleste konkurrenter mangler. 40% hastighetsgevinst på gjentatte oppgaver er reell og målbar.

Men den er ikke selvforbedring i den forstand science fiction har lært oss. Den blir ikke smartere. Den blir mer effektiv. Det er et avgjørende skille.

For norske team som vil eksperimentere med AI-agenter til en kostnad av €5–15 per måned, med null telemetri og full kontroll over data: Hermes Agent er verdt et seriøst pilotprosjekt. For de som tror de kjøper en agent som gradvis overgår menneskelig intelligens: gå hjem og sov på det.

Verifisert mot 4 åpne primærkilder (GitHub, innobu.com, petronellatech.com, cognio.so) og 2 uavhengige analyser (nxcode.io, Nous Research offisiell dokumentasjon).