선택적 공개 DPSGD의 프라이버시 회계 결함을 바로잡는 새 알고리즘 제안

머신러닝 모델 학습에서 민감한 데이터를 보호하기 위한 핵심 기법인 DPSGD(차등 프라이버시 확률적 경사 하강법)의 선택적 공개 변형 알고리즘에서 프라이버시 보장의 결함이 발견됐다. 연구팀은 기존 DPSUR(차등 프라이버시 선택적 업데이트 및 공개) 알고리즘이 선택적 공개 메커니즘으로 인해 발생하는 샘플링 확률 변동을 프라이버시 회계에 반영하지 않고 있음을 지적했다. 이 누락은 해당 알고리즘이 주장하는 프라이버시 보장의 엄밀성을 훼손하는 문제로 이어진다.

DPSGD는 그래디언트 클리핑과 노이즈 주입을 통해 프라이버시를 보호하지만, 그 과정에서 모델 성능이 크게 저하되고 수렴 속도가 느려지는 단점이 있다. 이를 개선하기 위해 제안된 DPSUR는 높은 모델 유용성을 달성했으나, 프라이버시 분석의 엄밀성에 문제가 있었던 것이다. 연구팀은 이 취약점을 해결하기 위해 선택적 공개 메커니즘의 프라이버시 분석을 전면 재검토했다.

연구팀이 새로 제안한 알고리즘은 DPSR-CG(클리핑 그래디언트 기반 차등 프라이버시 선택적 공개)다. 이 알고리즘은 새롭게 도출된 엄밀한 프라이버시 분석을 기반으로 하며, MNIST, CIFAR-10, IMDB, FMNIST 등 여러 데이터셋에 대한 광범위한 실험을 통해 엄격한 프라이버시 보장을 유지하면서도 높은 모델 성능을 달성함을 입증했다. 이 연구는 차등 프라이버시 알고리즘의 설계에서 프라이버시 회계의 정확성이 얼마나 중요한지를 재확인하는 성과로 평가된다.

차등 프라이버시는 AI 모델이 개인 데이터를 학습하면서도 특정 개인의 정보가 외부로 노출되지 않도록 수학적으로 보장하는 기술이다. 의료·금융 등 민감 데이터를 다루는 분야에서 AI 도입이 확대될수록, 프라이버시 보호 기법의 이론적 엄밀성에 대한 요구도 높아지고 있다. 이번 연구는 기존 방법론의 허점을 짚어내고 보완책을 제시했다는 점에서 학계의 관심을 받을 것으로 보인다.