젠슨 황(Jensen Huang) NVIDIA CEO가 델 테크놀로지스 월드(Dell Technologies World) 행사에서 차세대 AI 팩토리 플랫폼 Vera Rubin NVL72 시스템을 공개했다. 황 CEO는 이 자리에서 “수요가 포물선을 그리고 있다(Demand is going parabolic)”는 표현으로 AI 인프라 수요 급증세를 묘사했다. Vera Rubin은 NVIDIA의 차세대 GPU 아키텍처를 기반으로 설계된 AI 팩토리 시스템으로, 기존 세대 대비 에이전틱 AI 추론에 드는 토큰당 비용을 큰 폭으로 낮추는 것을 핵심 목표로 내세운 것으로 전해진다.
NVL72는 72개의 Vera Rubin GPU를 단일 랙 규모에 통합한 구성으로, 대규모 에이전틱 AI 추론 워크로드를 처리하도록 설계됐다. NVIDIA와 델은 이 시스템을 중심으로 한 파트너십을 심화해, 델의 PowerEdge 서버 라인업을 통해 기업 고객에게 AI 팩토리 솔루션을 제공한다는 계획이다. 에이전틱 AI는 단순 응답 생성에 그치는 챗봇과 달리 복잡한 다단계 작업을 자율적으로 수행하며, 이 과정에서 훨씬 많은 추론 연산을 필요로 한다. 토큰당 비용 절감은 에이전틱 AI의 경제적 실현 가능성을 높이는 핵심 조건이다.

NVIDIA는 컴퓨텍스 2026 시즌을 전후로 Vera Rubin 아키텍처 관련 발표를 잇달아 내놓고 있다. 델 테크 월드에서의 이번 공개는 엔터프라이즈 AI 팩토리 시장에서 델과의 협력을 공식화하는 자리로, 기업 데이터센터를 겨냥한 Vera Rubin 생태계 구축의 일환이다. NVIDIA는 추론 비용 절감을 통해 기업들이 에이전틱 AI를 실제 업무에 폭넓게 배치할 수 있는 경제적 조건을 만들어가고 있다고 강조했다.
AI 팩토리 시장은 클라우드와 온프레미스 모두에서 급격히 성장하고 있다. 전력·냉각·공간 효율이 핵심 경쟁 지표로 부상한 상황에서 랙 스케일 통합 시스템인 NVL72는 데이터센터 운영 밀도를 크게 높이는 방향을 제시한다. Vera Rubin 플랫폼의 실제 납품 일정과 양산 규모에 따라 AI 인프라 시장의 세력 구도가 재편될 것이라는 전망이 나온다.


