광주과학기술원(GIST) AI융합학과 김의환 교수 연구팀이 같은 공간을 서로 다른 시간과 경로에서 촬영한 영상을 비교해 실제 물체 변화를 자동으로 탐지하는 AI 모델 ‘VSCDNet’을 개발했다고 2일 밝혔다. 기존 변화 탐지 기술은 비슷한 위치와 시점에서 찍은 이미지를 한 장씩 비교하는 방식이어서 다른 경로로 촬영된 영상에서는 정확도가 떨어지는 한계가 있었다. VSCDNet은 사진 단위 비교 대신 영상 전체의 흐름을 분석해 등장·소멸·이동 같은 물체 변화를 찾아내는 접근 방식을 채택했다.
모델은 과거에 촬영된 기준 영상과 현재 영상을 비교해 서로 대응되는 장면을 찾고, 실제 물체 변화가 발생한 영역을 픽셀 단위의 ‘변화 마스크(Change Mask)’로 시각화한다. 연구팀은 1090개의 영상(약 113만 프레임 이상)으로 구성된 가상 공간과 실제 실내 환경 데이터셋을 직접 구축해 성능을 검증했다. 기존 변화 탐지 기법들과 비교한 결과 두 데이터셋 모두에서 가장 높은 성능을 보였으며, 영상 길이·화질·변화 물체 수 등 다양한 조건에서도 안정적인 탐지 능력을 유지했다. 실제 모바일 로봇을 활용한 실험에서는 로봇이 다른 경로로 이동하며 촬영한 영상에서 문이 열리거나 물체가 사라지는 상황을 자동으로 감지하고, 새롭게 등장한 물체를 기억해 학습하는 기능도 확인됐다.
이번 연구는 자율 로봇이 장기간 실내 공간을 스스로 이동할 때 필수적인 환경 변화 인식 능력을 별도의 위치 정보나 공간 지도 없이도 구현했다는 점에서 의미가 있다. 연구팀은 이 기술이 실내 순찰 로봇, 스마트 보안 감시, 시설 관리, IoT 기반 스마트 실내 시스템 등 다양한 분야에 활용될 수 있을 것으로 기대했다. 연구 결과는 오는 7월 서울 코엑스에서 개최되는 AI·기계학습 분야 세계 최고 학회 ICML 2026(International Conference on Machine Learning)에서 발표될 예정이다. 이에 앞서 논문은 지난 5월 사전 공개 사이트 아카이브(arXiv)에 게재됐다.














