샤오미가 플래그십 모델 ‘미모-V2.5(MiMo-V2.5)’ 시리즈의 응용프로그래밍인터페이스(API) 가격을 최대 99%까지 영구 인하했다. 공격적인 가격 정책을 펴고 있는 딥시크를 정조준한 전략으로 평가된다. 샤오미는 기존에 컨텍스트 길이에 따라 달랐던 복잡한 과금 체계를 없애고, 모든 구간에 동일 요금을 적용하기로 했다. 같은 금액으로 기존보다 5~8배 많은 토큰을 쓸 수 있도록 요금제도 개편했다.
가장 큰 폭의 인하는 고성능 추론 모델 ‘미모-V2.5-프로’에서 이뤄졌다. 입력 캐시 적중 비용은 100만 토큰 기준 기존 최대 2.80위안에서 0.025위안으로 낮아졌고, 비캐시 입력 가격은 최대 79%, 출력 가격은 최대 86% 내렸다. 일반형 모델도 입출력 가격이 최대 98%까지 떨어졌다. 이번 가격은 딥시크의 ‘V4 프로’와 사실상 같은 수준으로 책정돼, 개발자들이 추가 부담 없이 두 모델을 오갈 수 있게 됐다.

업계는 이번 인하를 단순 마케팅이 아니라 AI 인프라 효율화 경쟁의 결과로 본다. 미모-V2.5는 1조 개 이상의 매개변수 중 일부만 활성화하는 전문가 혼합(MoE) 구조로 추론 비용을 크게 낮춘 것으로 알려졌다. 추론 최적화와 서비스 효율 개선이 가격 인하의 배경이라는 설명이다.
중국 AI 시장에서는 가격 인하와 프리미엄 전략이 동시에 나타나는 ‘K자형 양극화’가 뚜렷해지고 있다. 알리바바·바이트댄스·샤오미·딥시크는 저가로 대규모 사용자 확보에 집중하는 반면, 일부 기업은 오히려 가격을 올리며 고성능·고신뢰 기업 시장을 노린다. 한 업체는 1분기 API 가격을 누적 83% 올렸음에도 기업 문의가 400% 늘었는데, 복잡한 작업에서는 단가보다 ‘작업 성공률’이 더 중요해졌기 때문이라는 분석이 나온다.
전문가들은 중국 AI API 시장이 단순 가격 전쟁을 넘어 생태계 기반의 장기 경쟁으로 진입했다고 본다. 대형 플랫폼은 API 자체보다 클라우드·하드웨어 확장 효과를 노려 저가 전략을 펼칠 수 있지만, 스타트업은 API 수익으로 연구개발을 충당해야 해 프리미엄을 유지할 가능성이 크다. 기업 고객은 단순 작업엔 저가, 고난도 작업엔 프리미엄 모델을 쓰는 ‘멀티 모델 라우팅’ 전략으로 옮겨갈 전망이다. 국내 기업으로서도 비용 최적화 관점에서 참고할 흐름이다.


