AI 추론(inference) 전문 스타트업 베이스텐(Baseten)이 130억 달러 기업가치를 기준으로 15억 달러 규모의 신규 투자 유치를 마무리 단계에 접어들었다고 월스트리트저널이 보도했다. 올해 1월 50억 달러 가치로 3억 달러 시리즈E를 완료한 지 불과 5개월 만이다. 이는 반년이 채 안 되는 기간 동안 기업가치가 160% 상승한 것으로, AI 인프라 투자 열기가 얼마나 뜨거운지를 단적으로 보여준다. 대형 언어 모델(LLM) 개발 경쟁이 정점에 달한 가운데, 모델을 실제 서비스로 전환하는 추론 계층으로 자본이 집중되는 구조적 흐름을 상징하는 사례로 업계의 주목을 받고 있다.
이번 라운드는 ‘분할 가격(split-priced)’ 구조로 진행된다고 알려졌다. 일부 투자자는 130억 달러 기준으로, 또 다른 투자자는 110억 달러 기준으로 참여하는 방식이다. 분할 가격 구조는 최근 스타트업들이 헤드라인 기업가치를 높이면서도 선행 투자자에게 유리한 조건을 제시하기 위해 활용하는 전략이다. 이번 라운드를 공동 주도하는 투자사로는 스파크 캐피털(Spark Capital), 샌즈 캐피털(Sands Capital), 알티미터 캐피털(Altimeter Capital), 웰링턴 매니지먼트(Wellington Management)가 거론된다. 이들은 전통적인 VC뿐 아니라 헤지펀드와 성장주 투자사까지 포함돼 있어, AI 인프라 스타트업에 대한 투자 주체가 다양해지고 있음을 보여준다.

2019년 설립된 베이스텐은 이른바 ‘추론 골드러시(inference gold rush)’의 최대 수혜주 중 하나로 꼽힌다. 사용자가 프롬프트를 입력하면 모델이 응답을 생성하는 과정, 즉 추론 단계를 빠르고 비용 효율적으로 처리하는 것이 이 회사의 핵심 역량이다. 특히 특정 작업에 최적화된 모델로 요청을 자동 라우팅하고, 비용 대비 성능이 뛰어난 오픈소스 모델을 적극 활용해 클라우드 비용을 절감하는 방식으로 기업 고객의 주목을 받아왔다. 이 회사는 시리즈D에서 1억5천만 달러, 시리즈E에서 3억 달러를 조달한 이후 불과 14개월여 만에 전체 조달 규모를 크게 늘리게 된다. 빠른 기업가치 상승의 배경에는 실제 고객 확보와 매출 성장이 뒷받침되고 있는 것으로 알려졌다.
이번 투자 사례는 AI 인프라 투자 구조가 근본적으로 달라졌음을 보여주는 신호로 읽힌다. 지금까지 VC 자금은 대형 언어 모델(LLM) 개발사를 중심으로 집중됐으나, 모델이 실제 서비스로 전환되는 추론 계층에 자본이 몰리는 추세가 뚜렷해지고 있다. 추론 비용은 전체 AI 운영 비용의 상당 부분을 차지하며, 이를 최적화하는 미들웨어 기업이 시장 가치를 빠르게 축적하고 있다. AI 추론 비용 최적화 트렌드와 AI 인프라 투자 현황에서 다뤘듯이, 추론 효율화는 이제 AI 도입의 핵심 병목으로 부상했다. AI를 실제 비즈니스에 적용하는 기업들이 늘어날수록, 모델 자체의 성능 차이보다 운영 비용과 응답 지연 시간이 구매 결정을 좌우하는 요소가 되면서 추론 최적화 솔루션의 수요는 구조적으로 확대될 수밖에 없다.
낙관적 시각에서 보면, 베이스텐의 기업가치 급등은 모델 성능 경쟁이 정점에 달한 시점에서 ‘어떻게 쓰느냐’의 경쟁이 본격화됐음을 뜻한다. 오픈소스 모델의 성능이 상업 모델을 빠르게 추격하면서, 어떤 모델을 만드느냐보다 어떤 모델을 얼마나 싸고 빠르게 서빙하느냐가 기업의 차별점이 되는 시대가 열린 것이다. 반면 회의적 시각도 존재한다. 분할 가격 구조 자체가 투자자 간 가격 이견을 시사하며, 헤드라인 기업가치가 실제 수익 기반보다 과대 포장될 위험이 있다는 점이다. 추론 인프라 시장은 AWS, 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure) 같은 하이퍼스케일러들도 직접 서비스를 강화하고 있어, 독립 스타트업의 장기 경쟁력이 어디까지 유지될지는 불확실하다.
베이스텐이 속한 추론 미들웨어 시장에서의 경쟁 구도도 빠르게 복잡해지고 있다. 앤트로픽(Anthropic), 오픈AI, 구글이 자체 모델의 서빙 효율을 지속 개선하는 한편, 투게더AI(Together AI), 그로크(Groq) 등 다른 추론 특화 스타트업들도 각자의 기술 차별점을 앞세워 경쟁하고 있다. 베이스텐이 이들과의 경쟁에서 우위를 지키려면 단순한 라우팅을 넘어 모델 특화 최적화, 실시간 부하 분산, 하드웨어 계층 통합 등으로 진화해야 한다. 이번 조달 자금의 상당 부분이 이 기술 고도화에 투입될 것으로 예상되는 이유다.
한국 기업 입장에서 이 흐름은 단순 관찰 대상이 아니다. 국내 AI 스타트업 다수가 미국 클라우드 서비스로 추론을 처리하면서 비용 부담을 호소하고 있는 가운데, 베이스텐 같은 추론 최적화 미들웨어의 확산은 비용 구조를 바꿀 수 있는 현실적 옵션으로 떠오른다. 동시에 국내에서도 유사한 추론 인프라 서비스를 개발하는 기업이 나온다면 상당한 시장 기회가 있다는 점에서 국내 투자자와 창업 생태계에 주는 시사점도 크다. AI 추론 비용 절감은 서비스 수익성과 직결되는 실질적 과제여서, 이 분야의 솔루션 수요는 국내 시장에서도 빠르게 커지고 있다.
향후 베이스텐의 행보에서 주목할 관전 포인트는 두 가지다. 첫째, 이번 자금으로 어떤 기술 우위를 확보하느냐다. 단순 라우팅을 넘어 모델별 특화 최적화, 실시간 부하 분산, 하드웨어 계층 통합 등으로 진화할 수 있는지가 장기 경쟁력을 가른다. 둘째, IPO 또는 대형 플랫폼 기업에 인수될 가능성이다. 추론 인프라 시장이 성숙하면 독립 운영보다 거대 플랫폼에 편입되는 경로가 더 유력할 수 있으며, 이 경우 이번 라운드에 참여한 투자자들의 회수 전략이 어떻게 전개될지도 주목된다. 베이스텐의 이번 조달이 상징하는 추론 인프라 투자 붐이 일시적 과열인지, 아니면 AI 산업 구조의 영구적 변화를 반영한 것인지는 앞으로 2~3년의 시장 흐름이 답을 줄 것이다.














