에이전트 툴 호출 일반화 높이는 MAVEN 검증 스캐폴드 공개
추가 훈련 없이 LLM 에이전트의 도구 호출 일반화 성능을 높이는 경량 검증 스캐폴드 MAVEN이 arXiv에 발표됐다.
추가 훈련 없이 LLM 에이전트의 도구 호출 일반화 성능을 높이는 경량 검증 스캐폴드 MAVEN이 arXiv에 발표됐다.
고정된 에이전트의 컨텍스트를 외부 LLM이 강화학습으로 관리하는 AdaCoM 기법이 arXiv에 공개됐다. 웹 검색·딥리서치 작업에서 성능을 끌어올린다.
LLM 에이전트의 자기진화 능력에서 '하네스 업데이트 능력'과 '업데이트된 하네스에서 이익을 얻는 능력'이 별개라는 연구가 공개됐다. 중간 성능 모델이 가장 큰 ...
전문가의 비정형 활동 기록을 분석해 LLM 에이전트가 사용 가능한 이식 가능한 스킬 패키지를 자동 생성하는 오픈소스 시스템이 공개됐다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.