LLM 에이전트 스킬 선택 구조화하는 SkillDAG 프레임워크 제안

LLM(대규모 언어 모델) 에이전트가 수많은 스킬 라이브러리에서 적절한 스킬 조합을 찾는 문제를 그래프 구조로 해결하는 프레임워크 SkillDAG가 공개됐다. 바이(Bai) 등 연구진이 2026년 6월 2일 arXiv에 등재한 논문에서는 스킬 간 의존·충돌·특수화·중복 관계가 기존의 전수 열거나 임베딩 유사도 탐색으로는 포착되지 않는다는 문제 의식에서 출발한다.

SkillDAG는 스킬 간 관계를 유형이 지정된 방향성 그래프(typed directed graph)로 모델링하고, 에이전트가 추론 시점에 직접 이 그래프에 질의하는 구조적 검색 인터페이스를 제공한다. 검색 결과는 벡터 유사도 매칭, 타입 엣지 인접 정보, 충돌 신호를 함께 반환하며, 에이전트가 실행을 마친 뒤 새 엣지를 그래프에 등록하는 ‘제안-확정(propose-then-commit)’ 프로토콜을 통해 실행 경험이 축적될수록 그래프 구조가 스스로 풍부해진다. ALFWorld와 SkillsBench 벤치마크에서 MiniMax-M2.7 모델을 사용했을 때 각각 성공률 67.1%와 보상 27.3%를 기록해 기존 Graph-of-Skills 최강 기준선보다 각각 12.8포인트, 8.6포인트 높은 성능을 달성했다고 논문은 밝혔다. 동일 조건의 내재적 검색 지표(SkillsBench Ret@K)도 65.5에서 78.2로 향상됐다.

A hand giving thumbs up next to profit chart on a whiteboard, indicating success. — 사진: Nataliya Vaitkevich / Pexels

연구진은 성능 향상의 원인을 두 가지 분리 가능한 메커니즘에서 찾는다. 첫째는 스킬 풀 크기가 10배로 늘어나도 후보 순위 지정 성능이 유지된다는 점이고, 둘째는 기존 검색 결과를 밀어내지 않으면서 정답 재현율을 높이는 온라인 엣지 편집 방식이다. LLM 에이전트가 실제 업무에 투입될수록 스킬 라이브러리 규모도 커지는 추세를 감안하면, 스킬 선택을 구조적 문제로 재정의한 이번 접근은 에이전트 시스템 설계에 실질적인 함의를 제공할 것으로 보인다. 논문 전문은 arXiv(arxiv.org/abs/2606.03056)에서 확인할 수 있다.