LLM(대규모 언어 모델) 기반 에이전트가 장기 상호작용 환경에서 과거 대화 정보를 보존하고 미래 작업에 활용해야 할 때, 메모리 저장소가 무제한 팽창하고 중복 항목이 쌓이면서 저장 비용이 늘고 유용한 정보를 찾는 검색 정확도가 떨어지는 문제가 발생한다. 리소스 제약이 있는 엣지 플랫폼처럼 메모리 예산이 고정된 환경에서 이 문제는 특히 심각하다. 이를 해결하기 위해 이미 구축된 메모리 저장소를 고정 예산 안에서 유지 관리하는 저장소-예산형 메모리 관리 문제를 형식화하고, LLM이 의사결정을 주도하는 프레임워크 MemRefine이 제안됐다.
MemRefine의 핵심 설계 원칙은 표면적 유사도와 사실 가치를 분리하는 것이다. 유사도는 후보 쌍 제안 단계에서만 활용하고, 실제 삭제·병합·보존 결정은 LLM 심판이 사실적 내용을 기반으로 내린다. 이 과정을 예산 한도에 도달할 때까지 반복하는 방식으로, 단순 유사도 기반 압축이 놓치는 사실적 가치 차이를 LLM 판단으로 보완한다. 기존 규칙 기반 방법들이 표면 특성에 의존하는 것과 달리 내용의 실질적 중요성을 기준으로 삼는다는 점에서 차별화된다.
다양한 메모리 프레임워크와 장기 대화 벤치마크를 대상으로 한 실험에서 MemRefine은 목표 예산을 일관되게 충족하면서도 다운스트림 성능을 유지했다. 특히 예산이 촉박한 조건에서 규칙 기반 기준선 방법들을 뛰어넘는 성능을 보였다. LLM 에이전트가 수개월 또는 수년에 걸친 상호작용을 관리해야 하는 개인 비서·업무 자동화 서비스 등 실제 배포 환경에서, 메모리 효율성과 검색 품질을 동시에 확보하는 것이 설계의 핵심 과제로 부상하는 가운데 MemRefine은 현실적 제약 조건을 직접 다루는 실용적 접근으로 평가된다.














