오픈소스 AI 에이전트 Hermes(Nous Research)의 내장 메모리가 실무 용도로는 너무 얕다는 문제의식에서 출발한 커뮤니티 프로젝트가 등장했다. 개발자 ClaudioDrews가 MIT 라이선스로 공개한 ‘Memory OS’는 Hermes 에이전트 위에 6개 레이어의 메모리 구조를 추가하는 라이브러리다. Docker, Qdrant, Redis, Python 3.11+ 환경에서 로컬로 동작하며, OpenRouter·OpenAI·Anthropic·Ollama 등 Hermes가 지원하는 모든 LLM(대규모 언어 모델) 제공자와 호환된다.
6개 레이어는 각기 다른 역할을 맡는다. 1층은 작업 공간(Workspace)으로, 매 대화 턴마다 시스템 프롬프트에 주입되는 MEMORY.md·USER.md·CREATIVE.md 파일이다. 2층은 세션(Sessions) 레이어로 FTS5 전문 검색을 지원하는 SQLite 기반 대화 이력 데이터베이스다. 3층은 구조화된 사실(Structured Facts)로, 신뢰 점수와 엔티티 해소 기능을 갖춘 장기 사실 저장소다. 4층은 패브릭(Fabric)으로, Icarus 플러그인을 포크해 세션 간 회상을 처리하는 16개 도구를 제공한다. 5층은 Qdrant 기반 벡터 데이터베이스로 4096차원 코사인 벡터와 BM25 희소 검색을 결합한다. 6층은 LLM이 자동으로 개념·엔티티·비교 정보를 편집하고 Qdrant에 지속 수집하는 위키(LLM Wiki)다. 검색 흐름은 LLM 호출 전(pre_llm_call) 실행되는 ‘외과적 회상(surgical recall)’이 핵심이다. Fabric·Qdrant·세션·사실 네 곳에서 동시에 검색하되, 각 소스마다 관련성 임계값을 적용하고 세션 내 중복 제거까지 거친다. 불필요한 메시지는 소셜 클로저 필터로 걸러낸다.
Memory OS는 mem0, Zep, Letta 같은 클라우드 메모리 서비스와 달리 메모리 데이터를 전적으로 로컬에 저장한다는 점을 차별점으로 내세운다. Hermes의 공식 지원 메모리 제공자 목록에는 포함되지 않은 별도 커뮤니티 프로젝트이며, 초기 단계여서 성능 벤치마크는 아직 공개되지 않았다. 설정 과정도 Docker·Qdrant·Redis·ARQ Worker를 모두 설치해야 해 상대적으로 복잡하다. 오픈소스 AI 에이전트에서 세션을 넘어 장기 기억을 구현하는 실험적 시도로서, 개인 데이터 주권을 중시하거나 데이터 잔류 규정이 엄격한 환경에 활용할 수 있는 방향으로 발전 가능성이 있다.


