여러 환경과 목표에 걸쳐 최적에 가깝게 행동하는 범용 에이전트(generalist agent)가 되려면 현재 상태 관찰만으로는 부족하며, 도메인 관련 정보를 메모리에 명시적으로 유지해야 한다는 이론적 연구가 arXiv에 발표됐다. 연구진은 두 도메인이 관측 병목(observational bottleneck)을 공유하면서 서로 양립할 수 없는 최적 행동을 요구하는 상황을 분석해, 이 경우 균일하게 최적에 가까운 정책이 존재하려면 해당 병목 지점에서 서로 다른 메모리 분포를 유도해야 한다는 ‘분리 정리(separation theorem)’를 도출했다.
이 결과는 범용 에이전트가 현재 상태 관찰에만 의존할 수 없음을 수학적으로 보여주는 것으로, 에이전트 설계에서 메모리의 역할을 명확히 규정하는 이론적 근거를 제공한다. 연구진은 나아가 에이전트의 메모리가 관련 목표들의 가치를 추정하기에 충분한 정보를 담고 있다면, 해당 메모리로부터 에이전트의 로컬 전이 역학(local transition dynamics)을 근사적으로 재구성할 수 있음도 증명했다. 즉 메모리가 단순한 맥락 저장소를 넘어 환경 모델 복원의 기반이 된다는 뜻이다.
이번 연구는 메모리가 범용 에이전트에서 도메인 구별, 전이 모델 재구성, 계획 수립이라는 세 가지 핵심 기능을 뒷받침하는 기반 구조임을 이론적으로 정립했다는 점에서 의의가 있다. 최근 대형 언어 모델 기반 에이전트에 장기 메모리 모듈을 추가하는 연구 흐름이 활발해지고 있는 가운데, 이 논문은 왜 메모리가 필요한지에 대한 원리적 해명을 제시한다.
범용 에이전트 연구에서 메모리 설계는 성능에 직결되는 핵심 요소임에도 이론적 토대가 부족했다. 이번 연구가 제시한 분리 정리와 메모리-전이 역학 재구성 결과는 에이전트 아키텍처 설계와 메모리 용량·구조에 관한 후속 연구의 출발점이 될 것으로 기대된다.














