직원들의 인공지능(AI) 사용량을 수치화해 순위를 매기던 빅테크들이 잇달아 해당 제도를 철폐하고 있다. 토큰(token, AI 모델이 텍스트를 처리하는 최소 단위) 소비량을 성과 지표로 삼았다가 직원들이 평가 점수를 높이기 위해 불필요한 AI 지시를 남발하는 부작용만 키웠기 때문이다. 소위 ‘토큰맥싱(Tokenmaxxing)’으로 불리는 이 현상은 비용만 폭증시키고 실질적 생산성 향상은 미미하다는 반성이 확산되면서 빅테크 내부에서도 공개적으로 제동이 걸리는 상황이다.
아마존은 자체 개발 AI 코드 생성 도구 ‘키로(Kiro)’의 사용 내역을 직원 점수에 반영하던 ‘키로랭크’ 제도를 최근 중단했다고 파이낸셜타임스(FT)가 5월 28일(현지시간) 보도했다. 데이브 트레드웰 아마존 엔지니어링 수석 부사장은 직원들에게 “순위표는 선의로 만들어졌지만 단순히 AI를 쓰기 위해 토큰을 쓰지 말라”고 당부한 것으로 전해졌다. 아마존은 이후 토큰 총량 대신 유용한 코드를 개발하기 위해 AI를 얼마나 규칙적으로 활용하는지를 측정하는 방향으로 지표를 전환했다. 메타(Meta) 역시 ‘클로드노믹스(Claudenomics)’라는 자체 순위표를 통해 전체 직원 8만5000명의 토큰 사용량을 추적하고 상위 250명에게 ‘불멸자’, ‘토큰 레전드’ 칭호를 부여하는 경쟁을 운영했다. 그러나 한 달 토큰 사용량이 60조 개를 돌파하고 1위 혼자 2810억 개를 소비하는 수준까지 낭비가 심해지자, 제도를 만든 내부 직원이 스스로 운영을 중단했다. 차량 공유 기업 우버(Uber)에서는 앤트로픽(Anthropic)의 코딩 도구 ‘클로드 코드(Claude Code)’ 이용에 연간 AI 예산을 4개월 만에 소진하는 사태가 벌어졌다. 앤드루 맥도널드 우버 최고운영책임자(COO)는 “기술연구팀이 AI 코딩 서비스를 사용하고 있지만 생산성 향상이 뚜렷하게 나타나지 않았다”며 투자수익률(ROI) 악화를 공개적으로 우려했다.

이 같은 흐름의 배경에는 토큰 소비를 생산성의 척도로 강조해온 빅테크 경영진의 발언이 자리한다. 젠슨 황(Jensen Huang) 엔비디아(NVIDIA) 최고경영자(CEO)는 지난 3월 팟캐스트에서 연봉 50만 달러(약 7억5200만 원) 수준의 엔지니어라면 연말에 25만 달러 이상을 토큰 구입에 써야 한다고 강조하며, 기본 급여 외에 별도 ‘토큰 예산’을 지급하자고까지 제안했다. 업계 일각에서는 황 CEO의 이 같은 발언이 엔비디아 GPU 매출 확대를 겨냥한 전략적 행보라고 분석하기도 한다. 반면 기업용 소프트웨어 기업 세일즈포스(Salesforce)는 토큰 수만 계산하는 방식에서 벗어나 에이전트가 실제로 처리한 업무 건수를 기준으로 삼는 에이전트 작업 단위(AWU, Agent Work Unit) 개념을 도입해 대안적 접근법을 제시하고 있다.
토큰맥싱 열풍의 퇴조는 AI 도입 핵심성과지표(KPI)의 설계 방식에 근본적인 물음을 던진다. 투입량(토큰 소비)을 성과로 착각하면 직원들은 쓸모없는 AI 작업을 만들어내고, 기업은 비용만 늘린 채 실질 가치는 놓치게 된다. 아마존·메타·우버가 각각 서로 다른 경로로 같은 교훈을 얻었다는 사실은 AI 내재화 경쟁이 ‘양’에서 ‘질’로 무게중심을 이동하는 변곡점에 접어들었음을 시사한다.


