User as Engram, LLM 사용자별 메모리를 LoRA보다 3.3만 배 작게 저장

언어 모델에 사용자 개인 정보를 기억시키는 새로운 방법 ‘User as Engram’이 제안됐다. 2026년 6월 17일 arXiv에 공개된 논문에 따르면, 현재 AI 개인화에는 크게 두 가지 방식이 쓰인다. 하나는 사용자 정보를 모델 가중치 외부의 자연어 메모리 파일이나 검색 인덱스에 저장하는 방식이고, 다른 하나는 사용자별 LoRA(Low-Rank Adaptation) 어댑터로 모델 가중치에 직접 기록하는 방식이다. 연구팀은 LoRA 방식이 뇌의 작동 방식과 반대로, 특정 사용자 내용과 일반 추론 능력을 하나의 전역 가중치 변화로 혼합해 버려 무관한 텍스트에도 영향을 미친다는 문제를 지적했다.

User as Engram은 뇌가 해마에 희소하고 국소적인 기억 흔적(engram)을 저장하고, 신피질에서 공유 추론 능력을 유지하는 방식에서 영감을 받았다. 사용자의 사실 정보를 Engram 모델의 해시 키 기반 메모리 테이블에 국소적 편집으로 저장하고, 추론 능력은 하나의 공유 어댑터가 담당하는 계층적 설계를 취한다. 이 방식은 사용자별 LoRA와 같은 수준의 직접 기억 회수 성능을 유지하면서, 간접 추론 정확도는 평균 5.6배 높고, 메모리 발자국은 약 3만3000배 작다고 논문은 밝혔다. 또한 여러 사용자의 편집이 서로 다른 해시 슬롯에 저장되므로 동시에 많은 사용자의 정보를 단일 공유 테이블에 손실 없이 누적할 수 있다.

이 연구는 AI 개인화 서비스의 확장성 문제에 실질적인 해법을 제시한다는 점에서 주목된다. 사용자별 LoRA는 사용자마다 별도의 전역 가중치 변화를 생성하기 때문에 사용자가 늘어날수록 관리 비용이 기하급수적으로 증가한다. 반면 User as Engram은 약 100개 이상의 사실이 축적되면 대형 모델의 검색 파이프라인보다도 빠른 회수 성능을 보이며, 다수 사용자가 하나의 모델에 공존할 수 있다. LLM(대규모 언어 모델) 기반 개인 비서, 의료 보조, 교육 서비스 등 장기적 사용자 맥락을 저장해야 하는 응용 분야에서 이 접근법의 실용적 가능성이 높은 것으로 평가된다.