엔비디아 Vera CPU, Phoronix 벤치마크서 인텔·AMD 능가 확인

엔비디아(NVIDIA)의 자체 설계 CPU인 베라(Vera)에 대한 첫 공개 벤치마크 결과가 하드웨어 전문 매체 Phoronix를 통해 공개됐다. 단일 소켓 Vera CPU는 최신 128코어 x86 프로세서 대비 전반적으로 1.5배의 성능 우위를 나타냈고, AMD EPYC 9575F 대비 평균 10% 높은 점수를 기록했다. Phoronix 창립자 마이클 라르벨(Michael Larabel)은 “ARM 또는 비-x86 프로세서 중 인텔·AMD와 이렇게 치열하게 경쟁한 사례를 본 적이 없다”고 평가했다.

Vera의 핵심은 엔비디아가 자체 설계한 올림푸스(Olympus) CPU 코어 88개다. Armv9.2 명령어 셋과 완전 호환되는 올림푸스는 분기 집약적 런타임, 샌드박스 코드 실행, 데이터 처리, 에이전트 오케스트레이션 같은 에이전틱 AI 워크로드에 최적화됐다. 메모리 서브시스템은 2세대 LPDDR5X를 채택해 최대 1.2TB/s 대역폭을 제공하며, 메모리 전력은 30와트 미만이다. 이는 기존 DDR5 기반 CPU의 100와트 이상 메모리 전력 대비 대폭 절감된 수치다. Phoronix의 STREAM TRIAD 테스트에서는 정격 피크 대역폭의 90%를 지속 유지해 Phoronix가 테스트한 CPU 중 최고 비율을 기록했으며, 코어당 메모리 대역폭은 기존 x86 CPU 대비 4배 이상이다.

A CPU and RAM sticks displayed on a white surface, showcasing computer hardware components. — 사진: Marta Branco / Pexels

실제 개발자 워크로드 결과도 주목할 만하다. 단일 소켓 Vera로 기본 리눅스 커널을 컴파일하는 데 20초가 걸려 Phoronix 역대 최단 기록을 세웠고, 코어당 컴파일 속도는 128코어 경쟁 제품 대비 2배 빠른 수치다. 직전 세대인 엔비디아 그레이스(Grace) CPU와 비교하면 Phoronix 기준 기하 평균 1.6배의 세대 간 성능 향상을 달성했다. 설계 전력(TDP)은 450와트로, 이 전력 봉투 안에서 코드 컴파일·파일 압축·영상 트랜스코딩·파이썬·자바·데이터베이스 등 광범위한 워크로드에서 우수한 결과가 나왔다.

엔비디아는 NVIDIA GTC에서 Vera에 대한 광범위한 생태계 파트너십을 발표했으며, 주요 AI 기업과 클라우드 공급사에 첫 물량을 이미 공급했다. 올해 하반기에는 파트너사를 통해 듀얼·싱글 소켓 시스템으로 정식 출시될 예정이며, 공랭식과 수랭식 옵션을 모두 지원한다. 에이전틱 AI 수요 증가로 AI 팩토리에 필요한 고대역폭·고효율 CPU 시장이 새롭게 부상하는 가운데, 엔비디아가 GPU에 이어 CPU 영역에서도 x86 진영에 본격적인 도전장을 낸 것으로 업계는 보고 있다.