누스 리서치, MCP 컨텍스트 폭증 잡는 Tool Search 출시…클로드 정확도 49→74%

누스 리서치(Nous Research)의 오픈소스 에이전트 프레임워크 허밋 에이전트(Hermes Agent)에 MCP(모델 컨텍스트 프로토콜) 도구 스키마 과부하를 줄이는 ‘Tool Search’ 기능이 새롭게 추가됐다. MCP는 AI 에이전트가 외부 도구 및 서비스와 상호작용하는 표준 규격으로, 다수의 MCP 서버를 연결할수록 각 도구의 JSON 스키마 전체가 매 응답 턴마다 모델 컨텍스트 창에 올라가는 구조적 문제가 있다. 실제 허밋 운영 환경에서 5개 MCP 서버·34개 도구를 연결했을 때 턴당 평균 4만5000 토큰이 사용됐고, 이 중 절반인 약 2만2000 토큰이 도구 스키마 단독 비용이었다. 앤트로픽의 자체 엔지니어링 데이터에 따르면 최적화 이전 도구 정의만으로 13만4000 토큰을 소비한 사례도 존재한다.

Tool Search는 이 문제를 점진적 공개(progressive disclosure) 방식으로 해결한다. 활성화되면 MCP와 비핵심 플러그인 도구는 컨텍스트 창에서 사라지고, 대신 세 개의 브릿지 도구 즉 도구 검색(tool_search), 스키마 로딩(tool_describe), 도구 호출(tool_call)이 그 자리를 채운다. 모델은 필요한 도구를 먼저 검색하고, 해당 스키마를 불러온 뒤, 실제 호출하는 방식으로 작동한다. 검색 엔진으로는 BM25 알고리즘을 사용해 도구 이름·설명·파라미터 이름을 조합해 매칭하며, BM25가 적합한 결과를 반환하지 못할 경우 도구 이름 문자열 직접 매칭으로 자동 전환된다. 도구 카탈로그는 턴마다 재생성되는 무상태(stateless) 구조라 라이브 도구 목록과의 동기화 오류가 발생하지 않는다.

High-resolution image of a tape measure and rulers, showing precise millimeter, centimeter, and inch markings. — 사진: William Warby / Pexels

앤트로픽의 내부 MCP 평가 결과, Tool Search 적용 후 성능 향상이 수치로 확인됐다. 클로드 오퍼스 4(Claude Opus 4)의 정확도는 49%에서 74%로, 클로드 오퍼스 4.5(Claude Opus 4.5)는 79.5%에서 88.1%로 각각 올랐다. 도구 정의 토큰 사용량은 85% 감소했다. 이는 단순한 비용 절감을 넘어 정확도 개선 효과도 입증된 것으로, 수백 개의 관련 없는 도구 옵션이 동시에 제시될 때 모델이 선택 장애에 빠지는 ‘결정 마비(decision paralysis)’ 현상을 해소한 결과로 분석된다.

Tool Search는 기본값으로 ‘자동(auto)’ 모드로 동작하며, 지연 로딩 대상 도구 스키마가 활성 모델 컨텍스트 창의 10% 이상을 차지할 때만 자동으로 활성화된다. 임계치 이하에서는 기존처럼 모든 도구 스키마를 직접 노출하므로 추가 오버헤드가 없다. 허밋 설정 파일에서 활성화 기준(threshold_pct), 기본 검색 결과 수(search_default_limit), 최대 검색 결과 수(max_search_limit)를 조정할 수 있어 운영 환경에 맞는 세부 튜닝이 가능하다. 대규모 멀티 서버 에이전트 환경에서의 컨텍스트 효율성과 정확도를 동시에 개선하는 실용적 솔루션으로 주목받고 있다.