아마존 SageMaker, 완전동형암호로 ML 추론 전 과정 암호화 구현

아마존 웹 서비스(AWS)가 완전동형암호(FHE·Fully Homomorphic Encryption)를 활용해 아마존 SageMaker AI에서 ML 모델 추론을 수행하면서도 입력 쿼리와 응답, 중간 연산값을 모두 암호화된 상태로 유지하는 구현 방법을 2026년 6월 8일 공식 블로그에서 소개했다. FHE는 데이터를 복호화하지 않고 암호화된 채로 연산할 수 있는 암호 기술로, 클라우드 서비스 제공자조차 원문 데이터에 접근하지 못하도록 설계된다는 점에서 민감 정보를 다루는 산업에서 주목받는다.

발표에 따르면 이 방식은 오픈소스 라이브러리 concrete-ml을 SageMaker AI에서 실행하는 방식으로 구현된다. 모델 학습은 평문 데이터로 진행되며, 훈련 완료 후 FHE 지원 형태로 변환된 모델이 추론 엔드포인트에 배포된다. 클라이언트는 암호키로 쿼리를 암호화한 뒤 S3를 통해 전달하고, SageMaker 엔드포인트는 복호화 없이 FHE 연산으로 예측값을 산출해 역시 암호화된 형태로 돌려보낸다. 다만 FHE 연산은 평문 처리 대비 최대 10만 배가량 느려질 수 있다는 성능 부담이 있으며, 양자화(quantization) 기법과 vCPU 수 확대로 완화할 수 있다고 설명했다. 구체적으로 ml.m5.xlarge 인스턴스에서 양자화를 적용해 오버헤드를 약 2800배 수준으로 낮췄고, 더 큰 ml.m5.24xlarge 인스턴스로 vCPU를 늘리면 약 500배까지 줄일 수 있다는 결과를 제시했다.

AWS는 이 접근법이 의료 기록 처리, 에너지 분야 위성 사진 분석, 통신사의 고객 이메일 스팸 탐지처럼 규제상 데이터를 외부에 노출할 수 없는 환경에 적합하다고 설명했다. 기존의 AWS Nitro 엔클레이브가 격리된 하드웨어 환경에서 평문 연산을 수행하는 것과 달리, FHE는 수학적 보호에 의존해 데이터가 처리 도중에도 암호화 상태를 유지한다는 차이가 있다. 단, FHE 자체는 모델 가중치를 보호하지 않으며 모델 자체는 클라우드 측에 노출될 수 있는 한계도 있다.

현재 concrete-ml은 Zama가 비상업적 용도에 한해 라이선스를 제공하고 있어 상용 배포 시 별도 계약이 필요하다. FHE 기반 ML 추론은 레이턴시가 중요한 실시간 서비스보다 비동기·배치 처리 방식에 적합하며, 프라이버시 규정이 엄격한 금융·의료·공공 분야에서의 채택 가능성이 높다는 평가다. AWS는 향후 보안과 클라우드 AI 성능을 동시에 요구하는 기업 고객을 대상으로 관련 활용 범위를 넓혀갈 방침이다.