시장조사 기관 ABI리서치는 2033년을 기점으로 AI 추론(Inference) 워크로드가 학습(Training) 워크로드 규모를 처음으로 추월할 것이라는 전망을 내놨다. ABI리서치 수석 애널리스트는 “모델 기능 향상과 에이전트 시스템의 컴퓨팅 요구 사항 증가로 인해 추론 시장이 놀라운 속도로 성장하고 있다”고 분석했다. 추론 워크로드는 연평균 42% 성장해 2035년에는 약 46GW 규모로 확대될 전망이며, 학습 워크로드는 같은 시점에 36GW 수준에 머물 것으로 예측됐다.
추론 부문 내에서도 코드 생성이 2035년 약 24GW로 추론 전체 전력의 절반 이상을 차지할 것으로 예상됐다. 텍스트 생성은 약 7GW, 오디오 생성은 연평균 42%라는 가장 빠른 성장률을 기록할 것으로 전망됐다. 학습 부문에서는 대규모 파운데이션 모델 학습(약 13GW)보다 파인튜닝(미세조정) 워크로드(약 21GW)가 더 빠르게 성장하는 구조 변화도 예측됐다. 이는 초거대 모델 개발보다 기존 모델을 특정 용도에 맞게 최적화하는 작업이 실질적인 수요를 더 많이 차지하게 된다는 의미다.
현재 AI 컴퓨팅 시장은 GPT·클로드(Claude)·제미나이(Gemini) 같은 대형 언어 모델(LLM) 훈련을 위한 학습 인프라 투자가 주도해왔다. 그러나 기업들이 AI를 실제 서비스와 업무 자동화에 적용하는 단계로 접어들면서, 학습된 모델을 실시간으로 활용하는 추론 수요가 폭발적으로 늘어나는 구조가 형성되고 있다. AI 에이전트의 확산이 이 흐름을 가속화하는 핵심 요인으로 꼽힌다. 에이전트는 복잡한 업무를 스스로 처리하기 위해 모델을 반복적으로 호출하며, 단일 요청보다 훨씬 높은 추론 컴퓨팅 자원을 소모한다.
ABI리서치의 이번 전망은 데이터센터 업계와 AI 칩 제조사들의 설비 투자 방향에도 영향을 줄 것으로 보인다. 추론 최적화 하드웨어와 이를 뒷받침하는 전력·냉각 인프라 수요가 2030년대 초반을 기점으로 본격 부상할 전망이다.














