En GitHub-issue på repoet til Nex-N2 fikk HN-undergrunnen til å gå bananas denne uka. Kjernen i saken: Rio de Janeiro skal ha lansert det som ble markedsført som en «hjemmelaget» stor språkmodell — en slags teknologisk stolthetssymbol for byen. Problemet? En håndfull community-folk gravde i modellvektene og arkitekturen, og mener det ser mistenkelig mye ut som en merge av allerede eksisterende open source-modeller.

For de som ikke er inne i det: en «merge» betyr at du blander sammen vekter fra to eller flere eksisterende modeller — det er en legitim teknikk, men det er ikke det samme som å trene en modell fra bunnen av. Det er omtrent forskjellen på å bake brød selv versus å kjøpe to brød og blande skivene.

Å overbevise folk om at du har bygget en LLM fra scratch er lett — å faktisk gjøre det koster mellom 50 000 og 100 millioner dollar.

Og det er akkurat der skoen trykker. Research på hva det faktisk koster å trene en LLM fra grunnen av er brutal lesning: selv en liten 7B-modell kan koste hundretusenvis av dollar i compute alene, og en skikkelig frontier-modell kan lett runde 100 millioner dollar. Det gjør det lett for et trent community-øye å lukte noe rart når en by plutselig annonserer sin «egne» modell uten tilsvarende ressurser.

Rio lurte alle: Byens «hjemmelagde» AI er bare en remiks - Bilde 1

Hva som gjør denne HN-tråden ekstra interessant er ikke bare avsløringen i seg selv — det er tempoet. Community-granskingen tok tilsynelatende ikke lang tid. Modellmerging er en utbredt praksis i open source-miljøet (og absolutt ikke ulovlig hvis lisensene tillater det), men å markedsføre resultatet som en «hjemmelaget» innovasjon er en annen sak. Det skaper falske forventninger og skjuler reell kreditering av de som faktisk trente originalmodellene.

Dette mønsteret er ikke nytt. Vi har sett lignende saker før der selskaper eller institusjoner tar eksisterende Llama- eller Mistral-baserte modeller, gjør litt fine-tuning eller merging, og presenterer det som noe revolusjonerende. Men med et stadig mer sofistikert open source-community blir det vanskeligere å komme unna med det.

Kildevurdering: Dette er basert på community-funn fra HN og GitHub. Ingen uavhengig teknisk audit er publisert ennå, og Nex-N2 / Rio-siden har per nå ikke kommet med en offentlig tilsvar. Følg med — dette kan utvikle seg raskt.