엔비디아·마이크로소프트, 에이전틱 AI 통합 스택 구축 파트너십 확대

엔비디아(NVIDIA)와 마이크로소프트(Microsoft)가 2026년 6월 2일 Build 2026에서 에이전틱 AI(agentic AI) 배포를 위한 통합 스택 파트너십을 대폭 확장했다. 엔비디아 CEO 젠슨 황(Jensen Huang)은 대만 타이베이에서 사티아 나델라(Satya Nadella) 마이크로소프트 CEO의 기조연설에 화상으로 참여해 양사 협력의 폭을 직접 발표했다. 이번 파트너십은 윈도우 디바이스·Azure 클라우드·온프레미스 환경을 하나로 연결하는 에이전트 인프라 구축을 목표로 한다.

하드웨어 측면에서 엔비디아는 RTX Spark 플랫폼을 윈도우 PC에 탑재하는 첫 세대 제품을 이번 가을부터 마이크로소프트 Surface, ASUS, 델(Dell), HP, 레노버(Lenovo), MSI 등 여러 제조사를 통해 출시할 예정이다. RTX Spark는 1페타플롭(PFLOP) AI 연산 성능과 최대 128GB 통합 메모리를 제공해 대형 언어 모델을 디바이스 내에서 직접 실행할 수 있다. 더 강력한 데스크사이드 AI 슈퍼컴퓨터인 DGX Station for Windows는 NVIDIA GB300 Grace Blackwell Ultra 슈퍼칩 기반으로 최대 748GB 통합 메모리와 20페타플롭(FP4 기준) 성능을 갖추며, 4분기 중 ASUS·델·HP·MSI 등에서 출시될 전망이다. 두 제품 모두 자율 에이전트를 위한 보안 런타임 NVIDIA OpenShell을 탑재한다.

클라우드 영역에서는 NVIDIA Nemotron 3 Ultra 추론 모델이 이달 중 Microsoft Foundry에서 제공되며, NVIDIA Cosmos 3와 Earth-2 날씨 예측 모델도 Azure를 통해 기업에 공급된다. NVIDIA 가속 컴퓨팅이 탑재된 Microsoft Fabric 데이터 웨어하우스는 마이크로소프트 내부 벤치마크 기준 CPU 기반 대비 SQL 실행 속도가 최대 6배, 주요 클라우드 데이터 웨어하우스 대비 최대 7배 빠른 성능을 기록했다고 회사 측은 밝혔다. 또한 NVIDIA OpenShell이 GitHub Copilot에 통합되며, 각 에이전트는 별도 샌드박스 컨테이너에서 실행돼 파일·네트워크·자격증명 접근이 정책에 따라 통제된다.

데이터센터 인프라 측면에서 마이크로소프트의 위스콘신 페어워터 AI 팩토리가 예정보다 앞당겨 가동을 시작했으며, NVIDIA Vera Rubin 플랫폼도 Azure 전 데이터센터에 배포하기 위한 검증을 완료했다. 엔비디아에 따르면 Vera Rubin은 Blackwell 대비 메가와트당 추론 처리량이 최대 10배 향상되고, 에이전트 토큰당 비용을 약 10분의 1 수준으로 낮춘다. 두 기업의 협력은 단순 클라우드 컴퓨팅을 넘어 AI 에이전트 시대의 전 계층 인프라를 함께 설계하는 방향으로 심화되고 있다.