제조 결함 탐지 등 실세계 이상 탐지(Anomaly Detection) 분야에서 기존 방법의 한계를 극복한 새로운 접근법이 제안됐다. MVTec과 같이 잘 정비된 데이터셋에서는 탐지와 분할 지표에서 거의 완벽한 성능을 보이는 방법들이 많지만, 객체 스케일·시점·배경·조명·배치 위치 등 기본 가정이 달라지면 성능이 급락하는 문제가 있었다.
연구진은 이 문제에 세 가지 핵심 기여를 통해 대응했다. 첫째, 전경-배경 마스킹으로 객체를 고립시키는 시각 프롬프팅(Visual Prompting) 파이프라인을 도입했다. 둘째, 학생-교사 모델에서 교사를 동결 상태로 유지하던 기존 방식에서 벗어나 교사를 학습 가능하게 풀어 도메인 적응성을 높이는 메커니즘을 제안했다. 셋째, 확산 모델로 생성한 합성 이미지를 활용하는 데이터 증강 전략을 적용해 이상 탐지 성능을 강화했다. 이 세 요소를 결합한 접근은 마스크드 멀티스케일 재구성(MMR) 모델을 백본으로 사용한다.
실험에서 이 방법은 조건 변화에 강건한 이상 탐지 성능을 측정하는 AeBAD 데이터셋에서 이전 최고 성능 대비 3.5%포인트 향상을 달성했다. 이는 실제 현장에서 발생하는 다양한 촬영 조건 변화에 보다 안정적으로 대응할 수 있는 이상 탐지 시스템의 가능성을 보여준다.
이 연구는 통제된 실험실 조건을 전제로 설계된 기존 이상 탐지 모델이 현장 배포에서 한계를 드러내는 문제를 정면으로 다룬다는 점에서 의미가 있다. 시각 프롬프팅과 교사 모델 유연화, 생성 모델 기반 증강을 결합한 접근은 자동 품질 검사, 의료 영상 분석 등 실세계 이상 탐지 응용 분야에 실질적인 기여를 할 것으로 기대된다.














