엔비디아 AI 팩토리, 기존 데이터센터와 다른 이유

엔비디아가 제시하는 ‘AI 팩토리’ 개념은 기존 AI 데이터센터와 용도와 하드웨어 구성 모두에서 뚜렷이 구분된다. 지금까지 구축된 대다수의 AI 데이터센터는 거대 언어모델 사전학습 등 모델 훈련에 초점을 맞췄고, 이를 위해 GPU를 CPU보다 4~8배 많이 배치하는 구성이 일반적이었다. 반면 AI 팩토리는 훈련을 마친 모델을 대규모로 배포하고, AI 에이전트를 실제 업무 환경에서 구동하는 것을 핵심 목표로 삼는다.

이 차이는 하드웨어 구성 비율에서 직접 나타난다. 엔비디아가 AI 팩토리 전용으로 준비한 루빈(Rubin) 플랫폼은 최신 CPU와 GPU를 1:1 또는 1:2 비율로 탑재하도록 설계됐다. 에이전트 전용 베라(Vera) CPU 서버 랙을 별도로 판매하는 방식도 포함된다. 소프트웨어 측면에서는 특정 분야에 AI를 최적화하는 파인 튜닝(미세 조정) 지원에 특화됐다는 점도 두드러진다. 의료 AI는 환자 데이터, 법률 AI는 판례 데이터, 제조 AI는 공정 수치 데이터를 고유 데이터셋으로 학습해야 하는데, AI 팩토리는 이런 전문 AI 양성 환경을 제공하는 시설로 기획됐다.

사진: Matheus Bertelli / Pexels

젠슨 황 엔비디아 최고경영자(CEO)는 이번 방한에서 SK하이닉스·SK텔레콤·SK그룹과 함께 향후 5기가와트(GW)급 AI 팩토리 구축 구상을 발표했다. 1GW급 AI 팩토리 한 채당 약 600억달러(약 91조원)의 시설 비용이 투입되는 것으로 알려져, 5GW 구상 전체를 완료하려면 최대 3000억달러(약 457조원) 규모의 자본이 필요하다는 계산이 나온다. 황 CEO가 한국을 ‘피지컬 AI 중심지’로 언급한 배경에는 제조업 현장에서 누적된 고품질 데이터를 AI 팩토리 기반 파인 튜닝에 활용할 수 있다는 판단이 깔려 있다.

AI 팩토리 개념은 AI 인프라 투자의 무게중심이 모델 개발 단계에서 실제 서비스 배포와 특화 적용 단계로 이동하고 있다는 흐름을 반영한다. 엔비디아가 GPU 가속 하드웨어를 넘어 배포·튜닝 인프라 전체를 패키지로 제공하는 방향으로 사업을 확장하는 가운데, 국내 대기업들의 대규모 투자 참여 여부가 주목받고 있다.