• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

User as Engram, LLM 사용자별 메모리를 LoRA보다 3.3만 배 작게 저장

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 20일 07시 03분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

언어 모델에 사용자 개인 정보를 기억시키는 새로운 방법 ‘User as Engram’이 제안됐다. 2026년 6월 17일 arXiv에 공개된 논문에 따르면, 현재 AI 개인화에는 크게 두 가지 방식이 쓰인다. 하나는 사용자 정보를 모델 가중치 외부의 자연어 메모리 파일이나 검색 인덱스에 저장하는 방식이고, 다른 하나는 사용자별 LoRA(Low-Rank Adaptation) 어댑터로 모델 가중치에 직접 기록하는 방식이다. 연구팀은 LoRA 방식이 뇌의 작동 방식과 반대로, 특정 사용자 내용과 일반 추론 능력을 하나의 전역 가중치 변화로 혼합해 버려 무관한 텍스트에도 영향을 미친다는 문제를 지적했다.

User as Engram은 뇌가 해마에 희소하고 국소적인 기억 흔적(engram)을 저장하고, 신피질에서 공유 추론 능력을 유지하는 방식에서 영감을 받았다. 사용자의 사실 정보를 Engram 모델의 해시 키 기반 메모리 테이블에 국소적 편집으로 저장하고, 추론 능력은 하나의 공유 어댑터가 담당하는 계층적 설계를 취한다. 이 방식은 사용자별 LoRA와 같은 수준의 직접 기억 회수 성능을 유지하면서, 간접 추론 정확도는 평균 5.6배 높고, 메모리 발자국은 약 3만3000배 작다고 논문은 밝혔다. 또한 여러 사용자의 편집이 서로 다른 해시 슬롯에 저장되므로 동시에 많은 사용자의 정보를 단일 공유 테이블에 손실 없이 누적할 수 있다.

이 연구는 AI 개인화 서비스의 확장성 문제에 실질적인 해법을 제시한다는 점에서 주목된다. 사용자별 LoRA는 사용자마다 별도의 전역 가중치 변화를 생성하기 때문에 사용자가 늘어날수록 관리 비용이 기하급수적으로 증가한다. 반면 User as Engram은 약 100개 이상의 사실이 축적되면 대형 모델의 검색 파이프라인보다도 빠른 회수 성능을 보이며, 다수 사용자가 하나의 모델에 공존할 수 있다. LLM(대규모 언어 모델) 기반 개인 비서, 의료 보조, 교육 서비스 등 장기적 사용자 맥락을 저장해야 하는 응용 분야에서 이 접근법의 실용적 가능성이 높은 것으로 평가된다.

Tags: LLM 개인화LoRAUser as Engram메모리파라미터 편집
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Yellow taxis and bustling traffic on a vibrant New York City street.
AI 모델·연구

일본 최대 IPO 기업 Go, 로보택시·M&A로 운전사 부족 돌파구 모색

2026년 06월 20일 12시 07분
A bustling scene of commuters waiting on a Mumbai train station platform. Captures Mumbai's daily life.
AI 모델·연구

릴라이언스 암바니, Jio AI로 통화·앱·가정 전면 통합 선언

2026년 06월 20일 12시 05분
A mysterious scene of keys floating above an open hand against a dark background.
AI 모델·연구

모니터랩, 제로 트러스트 전략 확장 — AI 에이전트와 MCP까지 통제해야

2026년 06월 20일 11시 56분
A person holding a clapper in their hand
AI 모델·연구

아마존, 오픈AI 500억 달러 투자 후 OpenAI 드라마 영화 돌연 취소

2026년 06월 20일 11시 35분
Next Post
Detailed macro shot of electronic microchip components on a circuit board.

구윤철 부총리, AX·피지컬 AI 예산·세제 지원…남부권 반도체 혁신벨트 추진

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
Close-up of a GeForce RTX graphics card on a desk, showcasing its design and technology.

엔비디아 RTX Spark, 윈도 노트북 판도 바꿀까…가격 걸림돌

2026년 06월 13일 09시 29분
Contemporary building with a glass facade and geometric patterns, low angle view.

앤트로픽·네이버 개발자 밋업 개최…서울 오피스 개소 앞두고 본사 임원 참석

2026년 06월 15일 20시 45분
책상에서 법률 문서에 서명하는 모습

클로드 ‘드리밍’ 기능 공개…앤트로픽, 법률·의료 AI 성능 대폭 향상

2026년 06월 15일 20시 45분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
Yellow taxis and bustling traffic on a vibrant New York City street.

일본 최대 IPO 기업 Go, 로보택시·M&A로 운전사 부족 돌파구 모색

2026년 06월 20일 12시 07분
A bustling scene of commuters waiting on a Mumbai train station platform. Captures Mumbai's daily life.

릴라이언스 암바니, Jio AI로 통화·앱·가정 전면 통합 선언

2026년 06월 20일 12시 05분
A mysterious scene of keys floating above an open hand against a dark background.

모니터랩, 제로 트러스트 전략 확장 — AI 에이전트와 MCP까지 통제해야

2026년 06월 20일 11시 56분
A person holding a clapper in their hand

아마존, 오픈AI 500억 달러 투자 후 OpenAI 드라마 영화 돌연 취소

2026년 06월 20일 11시 35분
Microsoft Dubai

마이크로소프트, AI 에이전트 보안 ‘에이전트 365’ 공개…기존 프레임 한계 지적

2026년 06월 20일 11시 28분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

카테고리

  • AI 모델·연구 (730)
  • AI 서비스·툴 (369)
  • 반도체·인프라 (283)
  • 빅테크·기업 (323)
  • 산업 적용 (235)
  • 스타트업·투자 (158)
  • 정책·윤리 (274)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

최근 뉴스

Yellow taxis and bustling traffic on a vibrant New York City street.

일본 최대 IPO 기업 Go, 로보택시·M&A로 운전사 부족 돌파구 모색

2026년 06월 20일 12시 07분
A bustling scene of commuters waiting on a Mumbai train station platform. Captures Mumbai's daily life.

릴라이언스 암바니, Jio AI로 통화·앱·가정 전면 통합 선언

2026년 06월 20일 12시 05분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.