스스로 장기 작업을 계획하고 실행하는 에이전틱 AI(agentic AI)가 기업 현장에 깊숙이 침투하면서, 토큰(token)이라는 기술적 단위가 기업의 예산과 성과를 가르는 핵심 비즈니스 지표로 부상하고 있다. 깃허브 코파일럿(GitHub Copilot), 앤트로픽(Anthropic) 등 주요 AI 서비스 제공사들은 정액 구독에서 사용량 기반 토큰 요금제로 전환을 가속하고 있으며, 이 변화는 재무 부서에 새로운 예산 관리 과제를 던지고 있다.
단순히 “토큰당 가격”을 비교하는 방식이 현장에서 점점 통하지 않고 있다. 같은 모델을 사용하더라도 작업의 속도, 전문성, 비즈니스 가치에 따라 토큰 가격이 달라지는 분화가 이뤄지고 있기 때문이다. 보안 취약점 분석이나 신약 개발처럼 고가치 결과물을 산출하는 작업에는 프리미엄 토큰 요금이 정당화된다. 엔비디아(Nvidia) CEO 젠슨 황(Jensen Huang)은 “토큰이 아이폰처럼 분화하고 있다”고 표현했다. 실제로 팔로알토 네트웍스(Palo Alto Networks)는 앤트로픽의 보안 모델 미토스(Mythos)를 활용해 약 3주 만에 기존 방식 대비 약 5배 많은 20여 건의 중요 취약점을 찾아내는 성과를 냈다.
반면 무분별한 토큰 소비가 오히려 성과 측정을 어렵게 만드는 부작용도 나타나고 있다. 우버(Uber)는 AI 코딩 도구 예산을 4개월 만에 소진했지만 실제 생산성 향상은 불명확한 것으로 알려졌다. 메타(Meta)와 아마존(Amazon)은 직원들이 의미 없는 작업으로 토큰 사용량을 늘리는 이른바 ‘토큰맥싱(tokenmaxxing)’ 문제가 발생하자 내부 리더보드를 철폐하기도 했다. 활동량은 측정되지만 실제 비즈니스 성과는 모호한 상황이 벌어진 것이다.
전문가들은 에이전틱 AI 도입 시 비용 제어를 사후가 아닌 사전에 설계해야 한다고 강조한다. 예산 한도, 에스컬레이션 규칙, 작업 중단 조건을 명확히 규정하고 저비용 모델부터 시작해 필요한 경우에만 고성능 모델로 라우팅하는 전략이 효과적이라고 조언한다. AI 컴퓨팅 비용이 늘어날수록 성과 기반 요금제, 이른바 “PR(풀 리퀘스트)당 비용” 같은 결과 연동 요금 모델이 등장할 수 있다는 시나리오도 제시되고 있다. 토큰 경제의 주도권은 단순히 많이 쓰는 기업이 아니라 가장 효율적으로 쓰는 기업에게 돌아갈 전망이다.














