기업들의 AI 토큰(token) 비용이 감당하기 어려운 수준으로 불어나면서 업계 전반에 비상이 걸렸다. 우버(Uber)는 2026년 AI 코딩 예산을 4월에 전부 소진했고, 마이크로소프트(Microsoft)는 내부 개발자에게 부여했던 클로드 코드(Claude Code) 라이선스를 수개월 만에 회수한 것으로 알려졌다. 프라이스라인(Priceline)의 한 직원은 커서(Cursor) 계약 갱신 비용이 기존 대비 4~5배로 올라왔다고 밝혔다. 토큰당 단가는 하락했지만, AI 도입 확대와 에이전트 자율 실행 기능의 부상으로 토큰 소비량 자체가 급격히 늘어난 결과다. 엔지니어링 관리 플랫폼 젤리피시(Jellyfish)에 따르면 AI를 가장 많이 쓰는 개발자는 그렇지 않은 동료보다 생산성이 두 배 높지만, 토큰 소비량은 10배에 달했다.
사태의 심각성을 단적으로 보여주는 사례도 있다. AI 관련 임원 한 명은 직원 사용 한도를 설정하지 않았다가 5억 달러에 달하는 클로드 청구서를 받았다는 이야기가 업계에서 회자된다. 파로스 AI(Faros AI)의 최고경영자 비탈리 고든(Vitaly Gordon)은 “한 개발자가 지난달 토큰에 4만 달러를 썼는데 그를 막아야 할지, 아니면 전 팀원에게 같은 방식을 권장해야 할지 모르겠다”는 CTO의 고충을 전했다. 퍼 개발자 기준 토큰 소비는 9개월 만에 약 18.6배 증가한 것으로 집계됐다. 이에 오픈AI(OpenAI) 엔터프라이즈 담당 임원은 “고객과의 대화 주제가 ‘이게 잘 되나요?’에서 ‘우리가 얼마나 쓰고 있나요?’로 완전히 바뀌었다”고 밝혔다.

이 문제를 해결하려는 시장도 빠르게 형성되고 있다. 리눅스 재단(Linux Foundation) 산하에 신설된 ‘토크노믹스 파운데이션(Tokenomics Foundation)’은 클라우드 비용 관리 분야의 핀옵스(FinOps)처럼 AI 토큰 비용에 표준 언어와 지표를 도입하겠다는 목표를 내걸었다. 7월 정식 출범을 앞두고 있으며, 다음 주 핀옵스X 컨퍼런스에서 추가 회원사를 발표할 예정이다. 페이-아이(Pay-i), 페이드(Paid) 같은 전문 스타트업 외에 데이터독(Datadog), 뉴 렐릭(New Relic), 램프(Ramp) 등 기존 플랫폼들도 토큰 비용 관리·모니터링 기능을 잇달아 추가하고 있다. 골드만삭스(Goldman Sachs)는 2030년까지 글로벌 토큰 사용량이 현재의 24배로 늘어날 것으로 전망해, 비용 통제 수단 마련이 기업 AI 전략의 핵심 과제로 부상하고 있음을 시사했다.














