• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

엔비디아 베라 루빈 플랫폼, 에이전틱 AI 대규모 확장 병목 해소

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 01일 18시 18분
Home 반도체·인프라
Share on FacebookShare on Twitter

엔비디아(NVIDIA)가 자사 베라 루빈(Vera Rubin) 플랫폼이 에이전틱(Agentic) AI 워크로드의 대규모 확장 문제를 해결하는 방식을 공식 블로그를 통해 공개했다. 에이전틱 추론(agentic inference)은 AI 에이전트가 과제를 수행하는 과정에서 행동·관찰·의사결정을 비결정론적으로 이어가기 때문에, 세션당 수백 건의 추론 요청이 누적되며 단대단 지연이 기하급수적으로 늘어나는 특성이 있다. 엔비디아는 베라 루빈 NVL72를 이 워크로드의 핵심 연산 엔진으로 제시했다.

핵심은 엔비디아 그로크 3 LPX(Groq 3 LPX)를 베라 루빈 NVL72와 결합한 것이다. 기존 데이터센터 네트워크는 대형 학습 작업이나 대용량 추론에 최적화돼 있어 소규모 배치·극저지연이 요구되는 에이전틱 워크로드에서 성능이 흔들렸다. 그로크 3 LPX의 LPU C2C(칩간 연결) 기술은 칩별 독립 클록에서 발생하는 드리프트를 플레시오동기(plesiosynchronous) 프로토콜로 보정해 수천 개의 LPU가 하나의 코어처럼 동작하도록 한다. LPU 한 개당 96개의 C2C 링크가 초당 112Gbps로 동작해 LPU당 약 2.5TB/s, 랙 전체로는 640TB/s의 스케일업 대역폭을 확보한다.

Close-up of a hand holding a smartphone showing the NVIDIA logo on screen with a blurred background.
사진: UMA media / Pexels

데이터 이동 방식도 기존과 다르다. 소프트웨어 컴파일러가 320바이트 벡터 단위의 통신 일정을 실행 전에 사전 배정(정적 스케줄)하기 때문에, 런타임 충돌이나 하드웨어 스케줄러의 경합 없이 수천 개 칩을 단일 실행 면처럼 다룰 수 있다. 멀티 에이전트 파이프라인에서 에이전트마다 자체 KV 캐시(키-값 캐시), 시스템 프롬프트, 도구 정의, 대화 이력을 갖고 조 단위 파라미터 모델을 통과해야 하는 부담을 이 구조가 흡수한다. 엔비디아는 이를 통해 고처리량과 저지연을 파레토 곡선의 신규 점(new Pareto point)에서 동시에 달성한다고 설명했다.

에이전틱 AI 시장이 빠르게 성장하면서, 수백에서 수천 개 칩을 묶어 예측 가능한 저지연으로 운용하는 능력이 플랫폼 경쟁력의 핵심 변수로 부상하고 있다. 엔비디아는 이번 구조를 통해 조 단위 파라미터 혼합전문가(MoE) 모델을 긴 컨텍스트 창 환경에서도 경제적으로 서비스할 수 있다고 밝혔다. AI 에이전트가 도구 호출·메모리 조회·다단계 계획 수립을 실시간으로 처리해야 하는 엔터프라이즈 수요가 커질수록, 결정론적 스케일업 네트워킹을 갖춘 플랫폼의 차별성이 더욱 부각될 전망이다.

Tags: AI인프라GroqNVIDIAVera Rubin에이전튱AI
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
A robotic helper cracks an egg into a bowl in a contemporary kitchen setting, showcasing automation in cooking.

무료 청소 서비스로 로봇 훈련 데이터 수집, 스타트업 Shift의 새 실험

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI과학 AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI인프라 Anthropic AWS ChatGPT Claude Co-Scientist Gemini GPU IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 기업공개 데이터센터 마이크로소프트 멀티모달 메타 반도체 벤치마크 보안 생산성 스타트업 스페이스X 시뮬레이션 아마존 앤트로픽 에이전트 엔비디아 엔터프라이즈 오픈AI 오픈소스 중국 클라우드 클로드 허깅페이스

최근 뉴스

Futuristic abstract artwork showcasing AI concepts with digital text overlays.

2026 음성합성 모델 현황: 구글·인월드·카르테시아가 선두

2026년 06월 01일 23시 57분
Smartphone displaying Alipay app on open laptop with online shopping site.

틱톡, 쇼핑·여행·금융 통합 슈퍼앱 전환 가속

2026년 06월 01일 23시 53분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.