엔비디아·AWS, RTX PRO 4500 기반 AI 인프라 협력 확대

엔비디아(NVIDIA)와 아마존 웹 서비스(AWS)가 대규모 AI 운영 환경을 겨냥한 협력 성과를 동시에 공개했다. AWS는 엔비디아 RTX PRO 4500 Blackwell Server Edition GPU를 탑재한 새 EC2 G7 인스턴스를 출시했으며, Amazon OpenSearch Serverless는 엔비디아 cuVS 라이브러리를 기반으로 GPU 가속 벡터 인덱싱을 기본값으로 채택했다. 여기에 AWS가 GB300 학습 워크로드 기준 엔비디아 Exemplar Cloud 자격을 취득하면서 양사의 AI 인프라 협력이 한층 깊어졌다.

EC2 G7 인스턴스는 전 세대인 G6 대비 AI 추론 성능이 최대 4.6배, 그래픽 처리 성능이 최대 2.1배 향상됐다. 최대 8개 GPU, 총 256GB GPU 메모리, 700Gbps의 EFA(Elastic Fabric Adapter) 지원 네트워킹, 최대 7.6TB 로컬 NVMe SSD를 갖춰 AI 추론뿐 아니라 미디어 렌더링, 공간 컴퓨팅, 가상 데스크톱 인프라(VDI), 데이터 분석 파이프라인까지 단일 인스턴스로 소화할 수 있다. G7 인스턴스는 AWS Deep Learning AMI(Amazon Machine Image), Amazon EKS, Amazon ECS 등을 통해 접근 가능하며, Amazon SageMaker AI 지원도 예정돼 있다.

Detailed close-up of a gaming PC's Radeon graphics card with vibrant RGB lighting, showcasing cables and hardware. — 사진: Gibson Chan / Pexels

OpenSearch Serverless에 기본 탑재된 cuVS는 검색증강생성(RAG), 시맨틱 검색, 추천 시스템 등 에이전트형 AI 구축에 필수적인 벡터 검색 속도를 높이는 핵심 라이브러리다. AWS에 따르면 기존 CPU 전용 방식 대비 벡터 인덱싱 속도가 최대 10배 빨라지고 비용은 4분의 1 수준으로 낮아진다. 10억 규모의 벡터 데이터베이스를 1시간 이내에 구축하는 것이 실용적인 범위에 들어왔다는 설명이다. 서버리스 구조 덕분에 워크로드가 유휴 상태일 때 운영 부담도 줄어든다.

Exemplar Cloud 자격은 엔비디아가 자체 레퍼런스 아키텍처 기준으로 클라우드 제공사의 대규모 학습 워크로드 성능을 검증하는 프로그램이다. 이 자격을 취득한 클라우드 제공사는 엔비디아 기준의 일관된 고성능 학습 환경을 보장한다는 의미여서, 기업 AI 팀이 클라우드 인프라를 비교 선택할 때 총소유비용(TCO) 산정에 활용할 수 있는 신뢰 지표가 된다. 양사는 이번 협력으로 AI 추론, 벡터 검색, 대규모 학습이라는 AI 인프라 전 계층을 아우르는 최적화 환경을 제공하게 됐다고 밝혔다.