• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

샤오미 ‘미모’ API 99% 인하… 딥시크 겨눈 중국 모델 가격 전쟁

STORIUM 편집부 작성: STORIUM 편집부
2026년 05월 30일 17시 43분
Home 빅테크·기업
Share on FacebookShare on Twitter

샤오미가 플래그십 모델 ‘미모-V2.5(MiMo-V2.5)’ 시리즈의 응용프로그래밍인터페이스(API) 가격을 최대 99%까지 영구 인하했다. 공격적인 가격 정책을 펴고 있는 딥시크를 정조준한 전략으로 평가된다. 샤오미는 기존에 컨텍스트 길이에 따라 달랐던 복잡한 과금 체계를 없애고, 모든 구간에 동일 요금을 적용하기로 했다. 같은 금액으로 기존보다 5~8배 많은 토큰을 쓸 수 있도록 요금제도 개편했다.

가장 큰 폭의 인하는 고성능 추론 모델 ‘미모-V2.5-프로’에서 이뤄졌다. 입력 캐시 적중 비용은 100만 토큰 기준 기존 최대 2.80위안에서 0.025위안으로 낮아졌고, 비캐시 입력 가격은 최대 79%, 출력 가격은 최대 86% 내렸다. 일반형 모델도 입출력 가격이 최대 98%까지 떨어졌다. 이번 가격은 딥시크의 ‘V4 프로’와 사실상 같은 수준으로 책정돼, 개발자들이 추가 부담 없이 두 모델을 오갈 수 있게 됐다.

Mobile device - Smartphone -- Smart-Serv
출처: Laboratoires Servier / Wikimedia Commons / CC BY-SA 3.0

업계는 이번 인하를 단순 마케팅이 아니라 AI 인프라 효율화 경쟁의 결과로 본다. 미모-V2.5는 1조 개 이상의 매개변수 중 일부만 활성화하는 전문가 혼합(MoE) 구조로 추론 비용을 크게 낮춘 것으로 알려졌다. 추론 최적화와 서비스 효율 개선이 가격 인하의 배경이라는 설명이다.

중국 AI 시장에서는 가격 인하와 프리미엄 전략이 동시에 나타나는 ‘K자형 양극화’가 뚜렷해지고 있다. 알리바바·바이트댄스·샤오미·딥시크는 저가로 대규모 사용자 확보에 집중하는 반면, 일부 기업은 오히려 가격을 올리며 고성능·고신뢰 기업 시장을 노린다. 한 업체는 1분기 API 가격을 누적 83% 올렸음에도 기업 문의가 400% 늘었는데, 복잡한 작업에서는 단가보다 ‘작업 성공률’이 더 중요해졌기 때문이라는 분석이 나온다.

전문가들은 중국 AI API 시장이 단순 가격 전쟁을 넘어 생태계 기반의 장기 경쟁으로 진입했다고 본다. 대형 플랫폼은 API 자체보다 클라우드·하드웨어 확장 효과를 노려 저가 전략을 펼칠 수 있지만, 스타트업은 API 수익으로 연구개발을 충당해야 해 프리미엄을 유지할 가능성이 크다. 기업 고객은 단순 작업엔 저가, 고난도 작업엔 프리미엄 모델을 쓰는 ‘멀티 모델 라우팅’ 전략으로 옮겨갈 전망이다. 국내 기업으로서도 비용 최적화 관점에서 참고할 흐름이다.

Tags: AI 모델 가격딥시크미모샤오미중국 AI
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
미니맥스, 차세대 'M3' 예고… 희소 어텐션으로 추론 15.6배 빨라진다

미니맥스, 차세대 'M3' 예고… 희소 어텐션으로 추론 15.6배 빨라진다

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI 검색 AI과학 AI규제 AI안전 AI 에이전트 AI에이전트 AI 인프라 AI 코딩 Anthropic AWS Claude Co-Scientist Gemini IPO LLM OpenAI SynthID 검색 구글 구글 딥마인드 기업공개 노동시장 데이터센터 딥시크 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 생산성 스노우플레이크 스타트업 투자 스페이스X 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 오픈소스 로봇 중국 챗GPT 클라우드 클로드 허깅페이스

최근 뉴스

유럽의회 스트라스부르 루이즈 바이스 건물 반원형 의회장 내부

EU AI법 옴니버스 합의: 기한 최대 16개월가량 연장, 딥페이크 신규 금지

2026년 05월 30일 21시 11분
그로크 LPU v1 칩 다이 사진

그로크, 기존 투자자 대상 6.5억 달러 추가 조달 추진

2026년 05월 31일 00시 20분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.