AI 추론(inference) 전문 스타트업 베이스텐(Baseten)이 130억 달러 기업가치를 기준으로 15억 달러 규모의 신규 투자 유치를 마무리 단계에 접어들었다고 월스트리트저널이 보도했다. 올해 1월 50억 달러 가치로 3억 달러 시리즈E를 완료한 지 불과 5개월 만이다. 반년이 채 안 되는 기간 동안 기업가치가 160% 상승한 것으로, AI 인프라 투자 열기가 얼마나 뜨거운지를 단적으로 보여준다.
이번 라운드는 ‘분할 가격(split-priced)’ 구조로 진행된다고 알려졌다. 일부 투자자는 130억 달러 기준으로, 또 다른 투자자는 110억 달러 기준으로 참여하는 방식이다. 라운드를 공동 주도하는 투자사로는 스파크 캐피털(Spark Capital), 샌즈 캐피털(Sands Capital), 알티미터 캐피털(Altimeter Capital), 웰링턴 매니지먼트(Wellington Management)가 거론된다. 전통적인 VC뿐 아니라 헤지펀드와 성장주 투자사까지 포함돼 AI 인프라 스타트업에 대한 투자 주체가 다양해지고 있음을 보여준다.

2019년 설립된 베이스텐은 이른바 ‘추론 골드러시(inference gold rush)’의 최대 수혜주 중 하나로 꼽힌다. 특정 작업에 최적화된 모델로 요청을 자동 라우팅하고, 비용 대비 성능이 뛰어난 오픈소스 모델을 적극 활용해 클라우드 비용을 절감하는 방식으로 기업 고객의 주목을 받아왔다. 시리즈D에서 1억5천만 달러, 시리즈E에서 3억 달러를 조달한 이후 불과 14개월여 만에 전체 조달 규모를 크게 늘리게 되며, 빠른 기업가치 상승의 배경에는 실제 고객 확보와 매출 성장이 뒷받침되고 있는 것으로 알려졌다.
이번 투자 사례는 AI 인프라 투자 구조가 근본적으로 달라졌음을 보여주는 신호로 읽힌다. VC 자금이 대형 언어 모델(LLM) 개발사를 중심으로 집중됐으나, 모델이 실제 서비스로 전환되는 추론 계층에 자본이 몰리는 추세가 뚜렷해지고 있다. 추론 비용은 전체 AI 운영 비용의 상당 부분을 차지하며, 이를 최적화하는 미들웨어 기업이 시장 가치를 빠르게 축적하고 있다. AI를 실제 비즈니스에 적용하는 기업들이 늘어날수록 모델 자체의 성능 차이보다 운영 비용과 응답 지연 시간이 구매 결정을 좌우하는 요소가 되면서, 추론 최적화 솔루션의 수요는 구조적으로 확대될 수밖에 없다.
낙관적 시각에서 보면, 베이스텐의 기업가치 급등은 ‘어떻게 쓰느냐’의 경쟁이 본격화됐음을 뜻한다. 오픈소스 모델의 성능이 상업 모델을 빠르게 추격하면서, 어떤 모델을 얼마나 싸고 빠르게 서빙하느냐가 기업의 차별점이 되는 시대가 열린 것이다. 반면 분할 가격 구조 자체가 투자자 간 가격 이견을 시사하며, 헤드라인 기업가치가 실제 수익 기반보다 과대 포장될 위험이 있다는 회의적 시각도 존재한다. 추론 인프라 시장에서 AWS, 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure) 같은 하이퍼스케일러들도 직접 서비스를 강화하고 있어, 독립 스타트업의 장기 경쟁력이 어디까지 유지될지는 불확실하다.
베이스텐이 속한 추론 미들웨어 시장의 경쟁 구도도 빠르게 복잡해지고 있다. 앤트로픽(Anthropic), 오픈AI, 구글이 자체 모델의 서빙 효율을 지속 개선하는 한편, 투게더AI(Together AI), 그로크(Groq) 등 다른 추론 특화 스타트업들도 각자의 기술 차별점을 앞세워 경쟁하고 있다. 이번 조달 자금이 모델 특화 최적화, 실시간 부하 분산, 하드웨어 계층 통합 등 기술 고도화에 투입될 것으로 예상되는 이유다. 베이스텐의 이번 조달이 상징하는 추론 인프라 투자 붐이 일시적 과열인지, 아니면 AI 산업 구조의 영구적 변화를 반영한 것인지는 앞으로 2~3년의 시장 흐름이 답을 줄 것이다.














