OpenAI tar et stort steg mot teknologisk selvstendighet. Selskapet har for første gang presentert en egenutviklet AI-prosessor – en applikasjonsspesifikk integrert krets (ASIC) med kodenavnet «Jalapeño» – ifølge Digi.no. Brikken representerer et skifte i selskapets infrastrukturstrategi og er ment å redusere avhengigheten av tredjeparts GPU-leverandører, først og fremst NVIDIA.

Bygget kun for inferens

I motsetning til NVIDIAs allsidige H100, som håndterer både AI-trening og inferens, er Jalapeño utelukkende konstruert for inferensoppgaver – altså prosesseringen som skjer når en ferdigtrenet modell besvarer brukerforespørsler i sanntid. Dette er den oppgaven ChatGPT, Codex og OpenAI API utfører milliardvis av ganger daglig.

Arkitekturen er ifølge tilgjengelig informasjon bygget fra bunnen av for å minimere kostbar dataflytting i store språkmodell-klynger, et kjent ytelseshinder i inferensarbeidsflyter. Brikken benytter en stor compute-chiplet kombinert med High Bandwidth Memory (HBM).

Jalapeño kjører inferens for omtrent halvparten av kostnaden til en typisk AI-GPU, ifølge Broadcom-sjef Hock Tan
OpenAIs egenutviklede AI-brikke kutter GPU-kostnadene med 50 prosent - Bilde 1

Utviklet på rekordtid med AI

Et av de mest bemerkelsesverdige aspektene ved Jalapeño er utviklingshastigheten. Fra første designsteg til produksjonsklar «tape-out» tok det kun ni måneder – en tid som er ekstremt rask etter bransjens standarder. OpenAI tilskriver dette bruken av egne AI-modeller i designoptimaliseringsprosessen, noe som illustrerer en mulig fremtidig norm for halvlederproduksjon.

Samarbeidspartneren Broadcom har tidligere bistått Google med utviklingen av selskapets TPU-er (Tensor Processing Units), noe som gir selskapet solid erfaring med nettopp denne typen spesialbrikker. TSMC, verdens ledende fabrikant av avanserte halvledere, produserer Jalapeño.

Ytelsespåstander som bør vurderes kritisk

Broadcom-sjef Hock Tan har uttalt at Jalapeños ytelse er sammenlignbar med NVIDIAs Blackwell-generasjon og Googles TPU-er. OpenAI selv rapporterer betydelig bedre ytelse per watt sammenlignet med «nåværende toppmoderne inferensprodukter». Det er imidlertid verdt å merke seg at disse påstandene primært kommer fra selskapene selv, og per nå er ingen uavhengige benchmarks publisert. Slike ytelsestall bør derfor leses med et kritisk blikk inntil tredjepartsvalidering foreligger.

Fra design til ferdig brikke på ni måneder – OpenAI brukte sine egne AI-modeller til å akselerere utviklingen

Utrulling i gigawatt-skala

Den initielle distribusjonen av Jalapeño er planlagt mot slutten av 2026, med vesentlige volumer forventet i løpet av 2027 og full produksjonsfart i første halvdel av 2028. Brikken skal rulles ut i gigawatt-skala datasentre i samarbeid med Microsoft og andre partnere.

9 mnd
Fra design til produksjonsklar brikke
50 %
Lavere driftskostnad vs. typisk AI-GPU

OpenAI beskriver Jalapeño som «det første steget i en flergenerasjons beregningsplattform». Ambisjonen er tydelig: å bygge opp en proprietær AI-infrastruktur som gir selskapet større kontroll over kapasitet, kostnader og utvikling – fremfor å være prisgitt NVIDIA-leveranser i et marked preget av knapphet og høye priser.

Hvordan brikken faktisk presterer under reelle produksjonsforhold, gjenstår å se. Men signalet er klart: de store AI-aktørene satser tungt på å eie sin egen silisium-fremtid.