arXiv에 2026년 6월 12일 발표된 논문이 뇌 신경과학의 ‘엔그램(engram)’ 개념을 인공 신경망에 적용하는 기하학적 프레임워크를 제안했다. 엔그램은 기억이 뇌에 물리적으로 새겨진 흔적을 뜻하는 신경과학 용어다. 깊은 신경망이 기억에 해당하는 식별 가능한 흔적을 전역적으로 뒤얽힌 파라미터 속에 보존하는지는 아직 열린 질문으로 남아 있었다.
연구진은 신경과학의 기억 기준인 특이성(specificity)·재활성화(reactivation)·충분성(sufficiency)·필요성(necessity)을 수학적 제약 역문제(constrained inverse problem)로 정식화했다. 이를 통해 개별 기억 흔적을 전역적으로 뒤얽힌 파라미터로부터 분리하는 폐형식 추정량(closed-form estimator)을 도출했다. 논문은 이 생물학적 유래의 해법이 파라미터 다양체(parameter manifold) 위에서의 자연 경사(natural gradient) 업데이트에 해당함을 보였다. AI 엔그램을 식별하면 학습된 지식을 정밀하게 조작할 수 있다. 특정 기억들의 집합을 반복 최적화 없이 선형 연산(linear arithmetic)만으로 결합하거나 삭제할 수 있다는 것이 핵심 주장이다.
연구진은 단순 다층 퍼셉트론(MLP)부터 LLM(대규모 언어 모델)까지 다양한 규모의 모델에서 실험해 AI 엔그램의 인과적 타당성과 확장성을 확인했다고 밝혔다. 이 결과는 생물학적 기억 이론과 인공 표현 학습 이론을 연결하는 동시에, 분산 저장 구조 안에서 기능적 특이성이 어떻게 공존하는지에 대한 기하학적 통찰을 제공한다.
AI 엔그램 연구는 모델 편집(model editing)과 기계적 해석 가능성(mechanistic interpretability) 연구에 새로운 접근법을 제시한다. 특정 학습 데이터의 영향을 제거하거나 지식을 정밀하게 주입하는 기술은 안전성·저작권·개인정보 보호 등 AI 거버넌스 과제와도 직결된다는 점에서 주목할 만한 연구다.














