아마존웹서비스(AWS)가 인메모리 데이터베이스 서비스 엘라스틱캐시(ElastiCache) for Valkey에 내구성(durability) 기능을 추가했다. 이번 업데이트로 엘라스틱캐시는 기존 캐싱 용도를 넘어 장애 시에도 데이터를 보존하는 영구 저장 워크로드까지 지원하게 됐다. AI 에이전트 메모리, 워크플로 상태 관리, RAG(검색 증강 생성) 지식 베이스, 결제 토큰화, 재고 관리 등이 새로운 활용 사례로 제시됐다.
내구성 옵션은 두 가지 모드로 제공된다. 동기식(synchronous) 모드는 최소 두 개의 가용 영역(AZ)에 데이터가 복제된 뒤 쓰기를 확인하는 방식으로, 데이터 손실 위험을 최소화하는 대신 쓰기 지연이 증가한다. 비동기식(asynchronous) 모드는 복제가 완료되기 전에 쓰기를 확인해 낮은 지연을 유지하지만, 장애 발생 시 최대 10초 치 데이터가 손실될 수 있다. AWS는 비동기 쓰기에서 복제 지연이 10초를 초과하면 기본 노드가 새 쓰기 요청을 일시적으로 거부하고, 정상화되면 자동으로 재개된다고 설명했다. 읽기 지연은 두 모드 모두 기존과 동일한 마이크로초 수준을 유지한다. 재시도 및 지수 백오프 기능을 갖춘 밸키 GLIDE(Valkey GLIDE) 클라이언트 사용이 권장된다.
새 기능은 엘라스틱캐시가 지원하는 밸키(Valkey), 멤케시드(Memcached), 레디스(Redis) 엔진 가운데 밸키 9.0 이상에서만 이용 가능하며, 전 리전에 걸쳐 제공된다. 밸키는 레디스의 오픈소스 포크(fork)로, 클라우드 환경에서 빠르게 채택이 늘고 있다. 기존 내구성 없는 엘라스틱캐시는 비용이 가장 낮은 기본 옵션으로 유지되며, 소스에서 데이터를 다시 불러올 수 있는 캐싱 시나리오에 여전히 적합하다. 개발자 커뮤니티에서는 새 기능이 아마존 메모리DB(MemoryDB)와 기능적으로 겹치는 부분에 대한 논의도 나오고 있다.
이번 업데이트는 생성형 AI 확산과 함께 인메모리 데이터베이스를 캐시 이상의 용도로 활용하려는 수요가 급증하는 흐름을 반영한다. AI 에이전트가 복잡한 작업을 수행할 때 중간 상태와 컨텍스트를 안정적으로 보존하는 저장소가 필요해지면서, 낮은 지연과 내구성을 동시에 요구하는 워크로드가 늘어나고 있다. 다만 업계 일각에서는 캐시와 영구 데이터 저장소의 역할을 혼동하면 예기치 않은 장애로 이어질 수 있다는 주의도 계속 제기된다.














