Agentisk AI — systemer som kan planlegge, resonnere og utføre komplekse oppgaver med minimal menneskelig inngripen — har lenge vært løfterik på papiret. Nå forsøker NVIDIA og Microsoft å levere den underliggende infrastrukturen som skal gjøre løftet om til virkelighet, ifølge et blogginnlegg fra NVIDIA.

Én sammenhengende stack

Partnerskapet tar sikte på å dekke hele kjeden: kraftig maskinvare, optimaliserte modeller, sikre kjøretidsmiljøer og et responsivt datalag. Ifølge NVIDIA er dette nødvendig for at agenter skal kunne kjøre stabilt over lang tid og i produksjonsmiljøer — ikke bare som demonstrasjoner i et laboratorium.

På Azure-siden ruller Microsoft ut hundretusenvis av NVIDIA Blackwell-GPUer, inkludert GB200 NVL72 rack-skala-systemer. Målet er en ytelse tilsvarende ti ganger dagens raskeste superdatamaskiner, noe som skal gi massiv kapasitet for inferensoppgaver i skyen.

1 petaflop
AI-ytelse per RTX Spark
128 GB
Unified memory per enhet
NVIDIA og Microsoft bygger fullstendig AI-stack fra sky til PC - Bilde 1

NIM-mikrotjenester og reasoning-modeller

Azure AI Foundry integrerer nå NVIDIAs NIM-mikrotjenester — ferdigoptimaliserte containere for over to dusin populære grunnmodeller. Disse er tilrettelagt for å akselerere inferens i agentbaserte arbeidsflyter.

I tillegg gjøres NVIDIAs Llama Nemotron Reason-modeller tilgjengelige via Azure AI Foundry, og de skal særlig egne seg for agentframeverk som LangChain Deep Agents. Nemotron 3 Ultra er også en del av tilbudet og er optimalisert for tunge resonneringsoppgaver.

Agentisk AI krever mer enn gode modeller — det krever rask maskinvare, sikre kjøretidsmiljøer og et responsivt datalag.

Sikkerhet under agentlaget

Et av de mer teknisk interessante elementene i samarbeidet er sikkerhetsrammeverket OpenShell, bygget på Microsofts eXecution Containers (MXC). Konseptet er at sikkerhets- og styringsmekanismene plasseres under agentlaget — ikke oppå det.

Dette innebærer sandkassekjøring, tilgangspolicyer og beskyttelse av personidentifiserbar informasjon. OpenShell integreres i Windows, Red Hat AI og Ubuntu, noe som gir bred plattformdekning.

Fra sky til skrivebord

For lokale distribusjoner presenterer NVIDIA to produkter. RTX Spark er en ny superchip beregnet på Windows-PCer og er ifølge NVIDIA spesialbygd for personlige AI-agenter. Med opptil 1 petaflop AI-beregning og 128 GB unified memory skal den gjøre det mulig å kjøre agenter lokalt og privat. RTX Spark-baserte laptoper og stasjonære maskiner er ventet til høsten 2026.

DGX Station for Windows retter seg mot bedriftsmarkedet og er en kompakt AI-superdatamaskin som kan kjøre modeller med opptil én billion parametere lokalt — uten å sende data til skyen.

Lokale AI-agenter med bedriftsnivå ytelse — uten skytilkobling

Vitenskapelig forskning og industriell AI

Samarbeidet strekker seg også inn i vitenskapelig forskning gjennom plattformen Microsoft Discovery, som ble presentert på Microsoft Build. Plattformen integrerer ALCHEMI NIM for kjemiske simuleringer og BioNeMo NIM for legemiddelutvikling, og er ment å fremskynde forskning innen vitenskap og medisin.

For industri er NVIDIA Omniverse-biblioteker koblet inn for å støtte digitale tvillinger og industriell fysisk AI. I tillegg lanserte NVIDIA og Microsoft det de kaller Agentic Launchpad — foreløpig rettet mot AI-innovatører i Storbritannia og Irland.

Konkurransen fra AWS og Google

NVIDIA og Microsofts fullstack-tilnærming konkurrerer med etablerte plattformer som AWS SageMaker og Google Vertex AI, som begge har innlemmet agentisk AI i sine tjenester. SageMaker tilbyr blant annet en «agentisk opplevelse» for modellkustomisering og en innebygd dataagent, mens Vertex AI har sine egne verktøy for agentutvikling.

Det som skiller NVIDIA-Microsoft-tilnærmingen, er integrasjonen av spesialisert maskinvare — fra rack-skala GPU-klynger i skyen til dedikerte chips i forbruker-PCer — kombinert med et felles sikkerhetsrammeverk på tvers av hele stacken. Hvorvidt denne vertikale integrasjonen gir reelle fordeler fremfor mer fleksible skyplattformer, gjenstår å se i praksis.