OpenAI og Broadcom har offentliggjort sin første felles AI-chip: en skreddersydd «Intelligence Processor» med kodenavnet Jalapeño. I motsetning til generelle AI-akseleratorer er brikken bygget fra bunnen av for én enkelt oppgave — inferens med store språkmodeller (LLM). Det melder OpenAI på sin offisielle blogg.

Nio måneder fra idé til produksjon

Et av de mest bemerkelsesverdige trekkene ved Jalapeño er utviklingshastigheten. Ifølge OpenAI gikk det bare ni måneder fra designstart til såkalt «tape-out» — det stadiet der chipen sendes til fabrikasjon. Det beskrives som et av de raskeste ASIC-utviklingsløpene i historien til høyytelses halvledere.

OpenAI oppgir at selskapet brukte egne AI-modeller aktivt i deler av design- og optimaliseringsprosessen, noe som bidro til å presse ned tidsbruken betraktelig.

Jalapeño er designet fra grunnen av med en dyp forståelse av hvordan store språkmodeller faktisk fungerer — ikke som en generisk akselerator tilpasset i etterkant.
OpenAI og Broadcom avslører Jalapeño: 50% billigere enn Nvidias beste - Bilde 1

Hva skiller Jalapeño fra konkurrentene?

Der GPU-er fra Nvidia og TPU-er fra Google er bygget for en bred portefølje av AI-arbeidsoppgaver, er Jalapeño eksklusivt innrettet mot inferens. Denne spesialiseringen gjør det mulig å optimalisere arkitekturen for å redusere databevegelse og balansere beregning, minne og nettverksressurser mer presist — med mål om å ligge nærmere teoretisk toppytelse i praksis.

Broadcom har ansvar for silisiumimplementasjon og høyytelses nettverkskomponenter, inkludert Tomahawk-nettverksbrikker. Celestica håndterer kortintegrasjon og skalerbar produksjon.

Hevder paritet med Nvidia Blackwell

Broadcoms konsernsjef Hock Tan skal ifølge research-materialet ha uttalt at Jalapeño er «like god» som Nvidias Blackwell-GPU-er og Googles TPU-er i datasentre. Det er en dristig påstand, men den støttes foreløpig ikke av uavhengige, offentlige benchmarks.

OpenAI opplyser at tekniske prototyper allerede kjører ML-arbeidsoppgaver i selskapets egne laboratorier, inkludert GPT-5.3-Codex-Spark. Utenforstående kan enn så lenge ikke verifisere ytelsestallene.

9 mnd
Tid fra design til tape-out
~50 %
Hevdet kostnadsbesparelse vs. AI-GPU-er

Hva sier konkurrentene?

I dag dominerer Nvidia LLM-inferensmarkedet med Blackwell-arkitekturen (B200, GB200). Benchmarks viser at B200 kan levere opptil fire ganger høyere gjennomstrømning enn forrige generasjons Hopper-GPU-er på modeller som Llama 3.3 70B. Google TPU v5p er på sin side optimalisert for store batchjobber i JAX-baserte miljøer.

Jalapeño entrer et marked der kravene til spesialisert inferenshardware øker kraftig i takt med at selskapene skalerer opp modelltjenester. Kostnadsargumentet — 50 prosent rimeligere per token — vil, dersom det holder vann i produksjon, være et sentralt konkurransefortrinn.

Ingen uavhengige benchmarks er publisert ennå — de ambisiøse ytelsespåstandene må verifiseres før markedet kan konkludere.

Utrulling ved slutten av 2026

Første produksjonsdistribusjon er planlagt til siste halvår 2026, med datasentre som Microsoft som tidlige partnere. OpenAI beskriver Jalapeño som den første i en flergeneras­jons plattform, der neste chip forventes i 2028 og deretter med årlige oppdateringer.

Hvor raskt og i hvilket omfang Jalapeño faktisk erstatter innkjøpte Nvidia-GPU-er i OpenAIs infrastruktur, gjenstår å se. Selskapet er fortsatt i et nært partnerskap med Microsoft som bruker Nvidia-utstyr i stor skala. Det er likevel tydelig at OpenAI, i likhet med Google og Amazon, ønsker å redusere sin avhengighet av tredjeparts AI-maskinvare på sikt.