위성·무인항공기(UAV) 영상 분석에서는 플랫폼과 촬영 시점이 다양해 특정 환경에 맞게 재훈련하지 않고도 범용적으로 동작하는 모델이 필요하다. 연구팀은 이 요구에 응답해 훈련이 전혀 필요 없는 폐쇄형(closed-form) 파이프라인 ZODS-RS를 개발했다. 이 시스템은 수평 박스(HBB) 탐지와 인스턴스 분할을 단일 파이프라인으로 통합한 것이 특징이다.
ZODS-RS는 DINOv3 밀집 특징과 SAM 스타일의 프로포절을 기반으로 구성되며, 세 가지 핵심 모듈이 연쇄적으로 작동한다. 타일러 공분산을 활용한 프로토타입 정제(PP), 분리 가능한 커널과 헝가리안 할당으로 회전·스케일 변화에 대응하는 R-SEM, 그리고 적응적 사전 확률과 선택적 음성 프로토타입을 갖춘 불확실성 인식 픽셀 병합(UAM)이다. 여기에 여러 DINOv3 레이어를 융합하는 경량 가중 레이어 집계 모듈도 포함된다.

공개 벤치마크 평가에서 ZODS-RS는 FAIR1M 데이터셋에서 선박·항공기 클래스 평균 mAP 13.06, xView 데이터셋에서 mAP 16.69를 기록했다. UAV 데이터셋에서는 마스크 mIoU 31.10을 달성했으며, 소형 객체 AP 지표에서 그라운디드-SAM 대비 30.70포인트 향상됐다. 연구팀은 이 시스템이 소형 객체와 밀집 타깃, 도메인 교차 상황에서 일관된 성능 개선을 보이면서도 별도의 파인튜닝 없이 즉시 배포할 수 있다는 점을 강조했다.
훈련 데이터 구축 비용과 도메인 적응 부담이 큰 원격 탐지 분야에서 무훈련 방식의 실용적 성능은 주목할 만하다. 향후 군사·재난 대응·농업 모니터링 등 실시간 공중 분석이 필요한 다양한 응용 분야에서 활용 가능성이 기대된다.














