• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

엔비디아 Vera CPU, 에이전틱 AI 워크로드 전용 설계로 AI 팩토리 새 기준 제시

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 01일 20시 08분
Home 반도체·인프라
Share on FacebookShare on Twitter

엔비디아(NVIDIA)가 에이전틱 AI(Agentic AI) 워크로드 전용으로 설계한 Vera CPU를 공개했다. AI 팩토리에서 모델 추론을 보조하는 CPU의 역할이 확대되면서, 기존 범용 프로세서로는 병목이 발생하는 에이전트 루프 실행·코드 샌드박스·다중 에이전트 조율 같은 작업을 전문적으로 처리하기 위한 목적으로 설계됐다.

Vera CPU는 NVIDIA가 자체 개발한 Olympus 커스텀 코어를 88개 탑재하며, 이전 세대 Grace CPU 대비 IPC(명령어당 사이클)가 50% 향상됐다. 메모리 대역폭은 최대 1.2TB/s의 LPDDR5X를 지원하고, 피크 메모리 레이턴시는 기존 대비 40% 낮아졌다. 전력 소비 측면에서도 DDR5 메모리 대비 절반 이하인 30W 미만의 메모리 전력을 구현했다. 그래프 순회와 분기 집약적 코드 실행에서 x86 최신 프로세서 대비 최대 3배 이상의 성능을 기록하며, 에이전트가 데이터를 반복 탐색하거나 복잡한 로직을 실행하는 시나리오에서 두드러진 우위를 보인다.

NVIDIA Vera CPU 에이전틱 AI 실행 루프 다이어그램
이미지: NVIDIA Technical Blog

AI 팩토리 시대에는 GPU 성능만큼이나 이를 뒷받침하는 CPU의 역할이 중요해졌다. 에이전트가 도구를 호출하고 중간 결과를 처리하며 다음 단계를 결정하는 과정에서 CPU는 비연속적이고 분기가 많은 연산을 담당한다. Vera CPU는 신경 분기 예측기와 10-wide 디코드 유닛, 깊은 비순서 실행 엔진을 갖춰 이러한 패턴에 특화됐다. NVIDIA는 성능 지표의 기준축이 “코어당 비용”에서 “달러당 토큰”으로 이동하는 흐름을 반영해 Vera CPU를 GPU 기반 추론 인프라의 필수 보완재로 위치시키고 있다.

Vera CPU는 샌드박스 코드 실행, 데이터 검색·처리, 강화 학습 환경 운영, 다중 에이전트 동시 실행 및 평가 루프 등 에이전틱 AI의 핵심 워크로드를 구체적인 대상으로 삼는다. 엔비디아 공식 발표에 따르면 최대 부하 조건의 샌드박스 성능에서 x86 대비 1.8배 높은 처리 성능을 달성했다. TDP는 250W~450W 범위에서 구성 가능하며, AI 팩토리 규모에 따라 유연하게 배치할 수 있도록 설계됐다.

Tags: AI 팩토리NVIDIAVera CPU에이전트제 AI인프라
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
AdventHealth advances whole-person care with OpenAI

어드밴트헬스, ChatGPT로 행정 부담 80% 줄이고 환자 케어 집중

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI과학 AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI인프라 Anthropic AWS ChatGPT Claude Co-Scientist Gemini GPU IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 기업공개 데이터센터 마이크로소프트 멀티모달 메타 반도체 벤치마크 보안 생산성 스타트업 스페이스X 시뮬레이션 아마존 앤트로픽 에이전트 엔비디아 엔터프라이즈 오픈AI 오픈소스 중국 클라우드 클로드 허깅페이스

최근 뉴스

Futuristic abstract artwork showcasing AI concepts with digital text overlays.

2026 음성합성 모델 현황: 구글·인월드·카르테시아가 선두

2026년 06월 01일 23시 57분
Smartphone displaying Alipay app on open laptop with online shopping site.

틱톡, 쇼핑·여행·금융 통합 슈퍼앱 전환 가속

2026년 06월 01일 23시 53분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.