• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

누스 리서치, MCP 컨텍스트 폭증 잡는 Tool Search 출시…클로드 정확도 49→74%

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 01일 17시 41분
Home AI 서비스·툴
Share on FacebookShare on Twitter

누스 리서치(Nous Research)의 오픈소스 에이전트 프레임워크 허밋 에이전트(Hermes Agent)에 MCP(모델 컨텍스트 프로토콜) 도구 스키마 과부하를 줄이는 ‘Tool Search’ 기능이 새롭게 추가됐다. MCP는 AI 에이전트가 외부 도구 및 서비스와 상호작용하는 표준 규격으로, 다수의 MCP 서버를 연결할수록 각 도구의 JSON 스키마 전체가 매 응답 턴마다 모델 컨텍스트 창에 올라가는 구조적 문제가 있다. 실제 허밋 운영 환경에서 5개 MCP 서버·34개 도구를 연결했을 때 턴당 평균 4만5000 토큰이 사용됐고, 이 중 절반인 약 2만2000 토큰이 도구 스키마 단독 비용이었다. 앤트로픽의 자체 엔지니어링 데이터에 따르면 최적화 이전 도구 정의만으로 13만4000 토큰을 소비한 사례도 존재한다.

Tool Search는 이 문제를 점진적 공개(progressive disclosure) 방식으로 해결한다. 활성화되면 MCP와 비핵심 플러그인 도구는 컨텍스트 창에서 사라지고, 대신 세 개의 브릿지 도구 즉 도구 검색(tool_search), 스키마 로딩(tool_describe), 도구 호출(tool_call)이 그 자리를 채운다. 모델은 필요한 도구를 먼저 검색하고, 해당 스키마를 불러온 뒤, 실제 호출하는 방식으로 작동한다. 검색 엔진으로는 BM25 알고리즘을 사용해 도구 이름·설명·파라미터 이름을 조합해 매칭하며, BM25가 적합한 결과를 반환하지 못할 경우 도구 이름 문자열 직접 매칭으로 자동 전환된다. 도구 카탈로그는 턴마다 재생성되는 무상태(stateless) 구조라 라이브 도구 목록과의 동기화 오류가 발생하지 않는다.

High-resolution image of a tape measure and rulers, showing precise millimeter, centimeter, and inch markings.
사진: William Warby / Pexels

앤트로픽의 내부 MCP 평가 결과, Tool Search 적용 후 성능 향상이 수치로 확인됐다. 클로드 오퍼스 4(Claude Opus 4)의 정확도는 49%에서 74%로, 클로드 오퍼스 4.5(Claude Opus 4.5)는 79.5%에서 88.1%로 각각 올랐다. 도구 정의 토큰 사용량은 85% 감소했다. 이는 단순한 비용 절감을 넘어 정확도 개선 효과도 입증된 것으로, 수백 개의 관련 없는 도구 옵션이 동시에 제시될 때 모델이 선택 장애에 빠지는 ‘결정 마비(decision paralysis)’ 현상을 해소한 결과로 분석된다.

Tool Search는 기본값으로 ‘자동(auto)’ 모드로 동작하며, 지연 로딩 대상 도구 스키마가 활성 모델 컨텍스트 창의 10% 이상을 차지할 때만 자동으로 활성화된다. 임계치 이하에서는 기존처럼 모든 도구 스키마를 직접 노출하므로 추가 오버헤드가 없다. 허밋 설정 파일에서 활성화 기준(threshold_pct), 기본 검색 결과 수(search_default_limit), 최대 검색 결과 수(max_search_limit)를 조정할 수 있어 운영 환경에 맞는 세부 튜닝이 가능하다. 대규모 멀티 서버 에이전트 환경에서의 컨텍스트 효율성과 정확도를 동시에 개선하는 실용적 솔루션으로 주목받고 있다.

Tags: ClaudeHermes AgentMCPNousResearchToolSearch
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
HuggingFace TRL이 Hub Bucket을 통한 델타 가중치 동기화 기능을 도입해 1조 파라미터 모델의 배포·업데이트를 효율화했다.

HuggingFace TRL, 델타 가중치 동기화로 1조 파라미터 RL 학습 전송 비용 99% 절감

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI과학 AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic AWS ChatGPT Claude Co-Scientist IBM IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 기업공개 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 생산성 생성형AI 스페이스X 아마존 앤트로픽 에이전트 엔비디아 엔터프라이즈 오픈AI 오픈소스 중국 클라우드 클로드 허깅페이스

최근 뉴스

나무 바닥 위를 걷는 소형 로봇 — 가정 환경 로봇 훈련 데이터

로봇 훈련 데이터 新사업… 스타트업 Shift, 집 청소 무료 제공 대가로 가정 영상 수집

2026년 06월 01일 21시 12분
여성 얼굴에 바이너리 코드가 투영된 디지털 개념 이미지 — AI 챗봇 인간 행동 시뮬레이션

AI 챗봇 유용성 훈련이 인간 행동 시뮬레이션 능력을 약화시킨다

2026년 06월 01일 20시 36분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.