AI 추론 전용 칩 스타트업 그로크(Groq)가 기존 투자자들을 대상으로 6억 5천만 달러(약 8,900억 원) 규모의 신규 투자 유치를 추진 중인 것으로 알려졌다. 악시오스(Axios)가 29일(현지시간) 단독 보도하고 테크크런치(TechCrunch) 등이 전한 내용으로, 그로크 측의 공식 확인은 없는 상태다.
보도에 따르면 이번 투자에는 기존 주요 주주인 디스럽티브(Disruptive)와 인피니티엄(Infinitium)이 참여를 확약했으며, 여타 기존 주주들에게도 보유 지분 비율에 따른 참여 기회가 주어졌다. 현재 임시 최고경영자(CEO)는 애덤 윈터(Adam Winter)가 맡고 있으며, 최고재무책임자(CFO)는 맷 엥(Matt Eng)이다.
그로크는 자체 개발한 추론 특화 칩(LPU·Language Processing Unit로 알려진)으로 주목받아 온 기업이다. 이번 자금 조달은 사업 모델 전환을 위한 것으로 알려졌다. 그로크는 하드웨어 판매 중심 사업에서 벗어나, 개발자와 기업이 AI 추론(inference) 애플리케이션을 직접 운용할 수 있는 ‘추론 네오클라우드(inference neocloud)’ 서비스로 사업 축을 옮기고 있다. 네오클라우드란 기존 범용 하이퍼스케일러와 달리 특정 AI 워크로드에 최적화된 신생 클라우드 서비스를 가리킨다.

이번 자금 조달 소식은 2025년 12월 엔비디아(Nvidia)와 맺은 200억 달러 규모의 대형 계약 이후 나온 것이다. 당시 계약은 단순 인수합병이 아닌 기술 라이선스 이전과 일부 인력 이동을 포함한 구조로, 기존 투자자들은 현금으로 보상을 받은 것으로 전해진다. 이 거래로 그로크는 하드웨어 공급 사업의 방향을 재설정하게 됐고, 클라우드 기반 추론 서비스로의 전환이 본격화했다.
이번 움직임은 AI 인프라 시장의 구조 변화를 반영한다. 대형언어모델(LLM) 학습(training) 단계에서 엔비디아 GPU가 독점적 지위를 유지하는 반면, 모델 서비스 단계인 추론 영역에서는 그로크의 자체 설계 칩처럼 특화 설계 칩이 속도와 비용 효율을 무기로 GPU 생태계에 도전하는 흐름이 뚜렷해지고 있다. 국내 AI 클라우드 사업자와 추론 서비스 운영사 입장에서도 GPU 의존도를 낮추고 추론 원가를 절감할 수 있는 특화 칩·서비스 선택지의 등장은 주목할 만한 변화다. 그로크의 네오클라우드 서비스 출시 시점과 투자 유치 마감 일정은 아직 공식 발표되지 않았다.


