En tråd som begynner å få fart på Product Hunt akkurat nå handler om Poolside og deres nye Laguna-modeller — og det er verdt å ta en ekstra titt før dette drukner i støyen fra de vanlige store navnene.
Poolside er et San Francisco-basert selskap som har flydd relativt lavt under radaren, men de har tydeligvis brukt tiden godt. Laguna-familien består av to modeller: M.1, som er flaggskipet med 225 milliarder totale parametre (men bare 23 milliarder aktiverte takket være MoE-arkitektur), og XS.2, en kompakt lillebror på 33 milliarder totale parametre med kun 3 milliarder aktiverte.
Begge er trent på 30 billioner tokens med ett klart formål: agentic coding. Ikke generelle chatbots. Ikke jobb-med-alt-modeller. Kode, lange oppgaver, verktøykall — det er dette de er bygget for.
Tallene som får folk til å løfte øyenbrynene: Laguna M.1 lander på 72,5% på SWE-bench Verified, noe som slår Devstral 2 (72,2%) og plasserer den rett under Claude Sonnet 4.6 (79,6%) på den listen. På SWE-Bench Pro nærmer M.1 seg modeller som Qwen-3.5 og DeepSeek V4-Flash — modeller som er vesentlig større.

Men det virkelig interessante er XS.2. Den scorer 44,5% på SWE-Bench Pro — nesten identisk med storebror M.1 — og er sluppet som open-weight under Apache 2.0. Du kan laste den ned, kjøre den lokalt, bruke den kommersielt. Og den krever bare 36 GB RAM, altså innenfor rekkevidde for en Mac Studio eller lignende.
Hvorfor er dette interessant utover bare benchmark-tallene? Fordi det viser at skreddersydd trening på agentic reinforcement learning og syntetisk datakurering kan kompensere massivt for ren modellstørrelse. Poolside har ikke vunnet ved å kaste mer compute på problemet — de har vunnet ved å fokusere.
M.1 er tilgjengelig gratis via Poolside sitt API og på OpenRouter akkurat nå (tidsbegrenset), noe som gjør at utviklere kan teste det uten å betale noe. Det senker terskelen for å faktisk prøve det selv.
Husk at dette er early signals fra community-kilder og produktsiden — uavhengige, langsiktige evalueringer av disse modellene i produksjon mangler fortsatt. Men tallene er gode nok til at det er verdt å holde øye med Poolside fremover. Spesielt hvis du jobber med agentic workflows og leter etter et open-weight alternativ som faktisk leverer.
