자율적으로 작동하는 LLM(대규모 언어 모델) 에이전트가 확산되는 가운데, 에이전트와 사용자 사이의 정보 비대칭 문제를 해결하기 위한 소통 정책 자동 진화 프레임워크 CPE(Communication Policy Evolution)가 제안됐다. 에이전트는 작업 수행에 필요한 정보를 얻기 위해 사용자에게 소통을 시도하지만, 소통 자체에 비용이 따르고 사용자의 선호도 역시 다양해 효과적인 정보 교환이 어렵다는 점이 이번 연구의 출발점이다. 연구는 arXiv에 2026년 6월 12일 게재됐다.
연구팀은 에이전트 소통 방식을 텍스트 기반과 구조화된 UI 기반의 두 가지 정책으로 형식화하고, 다양한 환경·사용자 페르소나·모델 조합에서 각 정책의 효과를 평가했다. 실험은 사용자-에이전트(User-Agent) 환경과 계획자-실행자(Planner-Executor) 환경의 두 가지 상호보완적 설정에서 진행됐다. 분석 결과 텍스트 기반 상호작용은 과제 수행 성능을 높이는 데 강점을 보이고, 구조화된 UI는 에이전트 응답 품질과 페르소나 준수도를 개선하는 데 효과적인 것으로 나타났다. 연구팀은 이 두 채널의 강점을 결합한 하이브리드 방법도 함께 제안했다.
CPE는 이러한 소통 정책을 롤아웃(rollout)과 프롬프트 수준의 진화를 통해 자동으로 정제하는 자기 진화 프레임워크다. 모델 파라미터를 수정하지 않고 프롬프트 정제만으로 다수의 실험 환경에서 최고 수준의 과제 성공률을 달성했다고 연구팀은 밝혔다. 이는 소통 정책 자체가 독립적인 최적화 대상이 될 수 있음을 보여준다.
연구팀은 LLM 에이전트 설계에서 소통 행동이 중요하지만 아직 충분히 탐구되지 않은 차원이라고 강조했다. 에이전트가 언제, 어떤 방식으로 소통하느냐에 따라 실제 유용성이 달라진다는 점에서, 이번 연구는 실용적인 에이전트 시스템 구축에 직접적인 시사점을 제공한다. 자율 에이전트가 다양한 현실 과제를 맡게 될수록 소통 전략의 설계와 자동화는 핵심 연구 과제로 부상할 것으로 전망된다.
—














