• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

AI 토큰 비용 폭증…기업들 예산 초과에 ‘비상’

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 06일 16시 09분
Reading Time: 1 min read
A A
Home AI 서비스·툴
Share on FacebookShare on Twitter

기업들의 AI 토큰(token) 비용이 감당하기 어려운 수준으로 불어나면서 업계 전반에 비상이 걸렸다. 우버(Uber)는 2026년 AI 코딩 예산을 4월에 전부 소진했고, 마이크로소프트(Microsoft)는 내부 개발자에게 부여했던 클로드 코드(Claude Code) 라이선스를 수개월 만에 회수한 것으로 알려졌다. 프라이스라인(Priceline)의 한 직원은 커서(Cursor) 계약 갱신 비용이 기존 대비 4~5배로 올라왔다고 밝혔다. 토큰당 단가는 하락했지만, AI 도입 확대와 에이전트 자율 실행 기능의 부상으로 토큰 소비량 자체가 급격히 늘어난 결과다. 엔지니어링 관리 플랫폼 젤리피시(Jellyfish)에 따르면 AI를 가장 많이 쓰는 개발자는 그렇지 않은 동료보다 생산성이 두 배 높지만, 토큰 소비량은 10배에 달했다.

사태의 심각성을 단적으로 보여주는 사례도 있다. AI 관련 임원 한 명은 직원 사용 한도를 설정하지 않았다가 5억 달러에 달하는 클로드 청구서를 받았다는 이야기가 업계에서 회자된다. 파로스 AI(Faros AI)의 최고경영자 비탈리 고든(Vitaly Gordon)은 “한 개발자가 지난달 토큰에 4만 달러를 썼는데 그를 막아야 할지, 아니면 전 팀원에게 같은 방식을 권장해야 할지 모르겠다”는 CTO의 고충을 전했다. 퍼 개발자 기준 토큰 소비는 9개월 만에 약 18.6배 증가한 것으로 집계됐다. 이에 오픈AI(OpenAI) 엔터프라이즈 담당 임원은 “고객과의 대화 주제가 ‘이게 잘 되나요?’에서 ‘우리가 얼마나 쓰고 있나요?’로 완전히 바뀌었다”고 밝혔다.

A woman is calculating expenses using a calculator and papers at her desk.
사진: www.kaboompics.com / Pexels

이 문제를 해결하려는 시장도 빠르게 형성되고 있다. 리눅스 재단(Linux Foundation) 산하에 신설된 ‘토크노믹스 파운데이션(Tokenomics Foundation)’은 클라우드 비용 관리 분야의 핀옵스(FinOps)처럼 AI 토큰 비용에 표준 언어와 지표를 도입하겠다는 목표를 내걸었다. 7월 정식 출범을 앞두고 있으며, 다음 주 핀옵스X 컨퍼런스에서 추가 회원사를 발표할 예정이다. 페이-아이(Pay-i), 페이드(Paid) 같은 전문 스타트업 외에 데이터독(Datadog), 뉴 렐릭(New Relic), 램프(Ramp) 등 기존 플랫폼들도 토큰 비용 관리·모니터링 기능을 잇달아 추가하고 있다. 골드만삭스(Goldman Sachs)는 2030년까지 글로벌 토큰 사용량이 현재의 24배로 늘어날 것으로 전망해, 비용 통제 수단 마련이 기업 AI 전략의 핵심 과제로 부상하고 있음을 시사했다.

Tags: AI비용FinOpsLLM기업AI토큰
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Abstract image of a vibrant purple and pink fiber optic light glowing at night.
AI 서비스·툴

Wasmer, OpenAI Codex로 2주 만에 엣지용 Node.js 런타임 구축

2026년 06월 06일 16시 59분
A professional man in a law office reads a document, symbolizing focus and diligence.
AI 서비스·툴

트럼프 AI 안전 검토 행정명령, 보여주기식이라는 비판 잇따라

2026년 06월 06일 16시 42분
Person wearing black glove grabbing a vaccine vial against a bright red backdrop.
AI 서비스·툴

케임브리지대, AI가 설계한 항원으로 범용 백신 임상 시험 성공

2026년 06월 06일 16시 19분
Detailed macro shot of electronic circuit board showing microchips and components.
AI 서비스·툴

퀄컴 AI 허브 모델로 분류·객체탐지·온디바이스 배포 실습하기

2026년 06월 06일 14시 42분
Next Post
Person wearing black glove grabbing a vaccine vial against a bright red backdrop.

케임브리지대, AI가 설계한 항원으로 범용 백신 임상 시험 성공

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
Researchers in lab coats analyzing experimental notes during a scientific study.

능동 탐색이 AI·인간의 인과 추론을 어떻게 바꾸는가

2026년 06월 06일 17시 10분
Close-up of a hand using a smartphone in the dark with blurred city lights in the background.

중국 AI 챗봇 더우바오, 유료화 루머로 월 이용자 610만 명 이탈

2026년 06월 06일 17시 10분
Abstract image of a vibrant purple and pink fiber optic light glowing at night.

Wasmer, OpenAI Codex로 2주 만에 엣지용 Node.js 런타임 구축

2026년 06월 06일 16시 59분
Close-up view of a camera monitor displaying captured footage with detailed settings.

xAI, Grok Imagine 1.5 출시…이미지를 720p 동영상으로 변환

2026년 06월 06일 16시 51분
A dramatic shot of a SpaceX rocket launch against a colorful dusk sky, depicting power and technology.

구글, SpaceX에 월 9억 2천만 달러 컴퓨팅 비용 지급 계약

2026년 06월 06일 16시 44분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로보틱스 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 온디바이스AI 의료AI 자율주행 젠슨황 피지컬AI

카테고리

  • AI 모델·연구 (296)
  • AI 서비스·툴 (148)
  • 반도체·인프라 (155)
  • 빅테크·기업 (144)
  • 산업 적용 (124)
  • 스타트업·투자 (78)
  • 정책·윤리 (138)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로보틱스 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 온디바이스AI 의료AI 자율주행 젠슨황 피지컬AI

최근 뉴스

Researchers in lab coats analyzing experimental notes during a scientific study.

능동 탐색이 AI·인간의 인과 추론을 어떻게 바꾸는가

2026년 06월 06일 17시 10분
Close-up of a hand using a smartphone in the dark with blurred city lights in the background.

중국 AI 챗봇 더우바오, 유료화 루머로 월 이용자 610만 명 이탈

2026년 06월 06일 17시 10분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

스토리움(STORIUM)  |  상호: [[상호]]  |  대표: [[대표자명]]  |  사업자등록번호: [[000-00-00000]]
인터넷신문 등록번호: [[등록 후 입력]]  |  발행인: [[발행인]]  |  편집인: [[편집인]]  |  청소년보호책임자: STORIUM 편집부
주소: [[사업장 주소]]  |  이메일: lee.kkhwan@gmail.com
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

스토리움(STORIUM)  |  상호: [[상호]]  |  대표: [[대표자명]]  |  사업자등록번호: [[000-00-00000]]
인터넷신문 등록번호: [[등록 후 입력]]  |  발행인: [[발행인]]  |  편집인: [[편집인]]  |  청소년보호책임자: STORIUM 편집부
주소: [[사업장 주소]]  |  이메일: lee.kkhwan@gmail.com
© 2026 STORIUM. All Rights Reserved.