• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

깃허브, MCP 도구 정리로 에이전트 토큰비용 최대 62% 절감

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 02일 16시 32분
Home AI 서비스·툴
Share on FacebookShare on Twitter

깃허브가 자사 저장소에서 돌리는 에이전트형 워크플로의 토큰 사용량을 줄인 결과를 공개했다. 미사용 MCP(모델 컨텍스트 프로토콜) 도구를 정리하고, MCP 호출을 깃허브 명령줄도구(CLI) 호출로 대체하며, 일일 감사·최적화 에이전트를 추가한 끝에 최대 62%의 절감을 기록했다고 밝혔다. 지속적 통합(CI) 환경에서 예약 작업이 눈에 띄지 않게 비용을 쌓는 모든 팀에 참고가 될 만한 사례다.

깃허브는 모든 에이전트 호출을 API 프록시로 거치게 하고, 실행마다 입력·출력·캐시 토큰을 한 형식으로 기록한다. 모델 등급 간 비교를 위해서는 출력 토큰에 4배, 캐시 읽기에 0.1배 가중치를 주고 모델별 배수(하이쿠 0.25배, 소네트 1.0배, 오퍼스 5.0배)를 적용한 ‘유효 토큰(ET)’ 지표를 쓴다. ET가 10% 줄면 어떤 모델을 쓰든 비용이 10% 준다는 의미다.

Close-up of Scrabble tiles spelling 'Token' on a wooden surface with a blurred green background.
사진: Markus Winkler / Pexels

최적화는 두 에이전트가 주도한다. 일일 토큰 감사 에이전트가 워크플로별 소비량을 집계해 비정상 실행과 고비용 작업을 짚어내면, 일일 최적화 에이전트가 소스와 최근 로그를 읽고 구체적 개선안을 담은 이슈를 연다. 가장 흔한 비효율은 미사용 MCP 도구였다. LLM API는 상태를 저장하지 않아 매 요청에 도구 명세를 함께 보내는데, 도구 40개짜리 MCP 서버는 매 턴 10~15KB의 명세를 더한다. 불필요한 항목을 지우면 호출당 8~12KB가 줄었다.

실제 12개 운영 워크플로 가운데 이슈 자동 분류는 62%, 보안 가드는 43%, 스모크 테스트는 59% 감축됐다. 다만 깃허브는 MCP 정리가 만능이 아니라고 선을 그었다. 도구 명세가 전체 컨텍스트에서 차지하는 비중이 작은 워크플로에서는 미사용 도구 8개를 지워도 효과가 없었다는 것이다. 회사는 가장 저렴한 LLM 호출은 아예 하지 않는 호출이라며, 다음 단계로 저장소 전반의 중복 작업을 겨냥하겠다고 밝혔다. AI 에이전트 운영비를 고민하는 국내 개발팀에도 실측 기반 절감 방법론으로 의미가 있다.

Tags: AI에이전트LLMMCP깃허브토큰비용
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
Analyzing a bullish financial chart highlighting a significant upward trend in the market.

구글 보안 엔지니어, 폴리마켓 내부정보 거래로 체포

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Co-Scientist Gemini GPU IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 스타트업 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 자율주행 클라우드 클로드 허깅페이스 휴머노이드

최근 뉴스

A large robot stands beside a small toy robot with colorful studio lighting, showcasing technology innovation.

허깅페이스, 2500달러 3D 프린팅 휴머노이드 다리 공개

2026년 06월 02일 18시 22분
Close-up of a modern server unit in a blue-lit data center environment.

카프카, 계층 스토리지 거쳐 ‘디스크리스’ 클라우드 네이티브로 진화한다

2026년 06월 02일 18시 00분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.