드론 자율 항법 정밀도 13.82% 향상, 3DG-VLN 프레임워크 제안

드론이 목표물을 시야 안에 포착한 후 정확하게 접근하는 단계를 독립적으로 평가하고 개선하는 새로운 연구가 발표됐다. 논문 ‘See-and-Reach’는 UAV(무인항공기) 비전-언어 내비게이션(VLN) 분야에서 기존 연구가 간과해 온 ‘최종 접근 단계’의 정밀성을 집중 분석한다. 기존 UAV-VLN 연구는 원거리 목표물 탐색과 최종 도달을 하나의 통합 과제로 다뤄왔기 때문에, 목표물이 이미 카메라 시야 안에 들어온 상황에서 드론이 얼마나 정밀하게 착지점까지 접근할 수 있는지를 별도로 측정하기 어려웠다.

연구팀은 이 한계를 극복하기 위해 UAV-VLN-FOV라는 새로운 세부 과제를 정의했다. 이 설정은 목표물이 드론의 시야 내에 위치한 상황만을 가정해 ‘포착 후 접근(see-and-reach)’ 단계의 성능을 진단적으로 평가할 수 있게 한다. 이를 지원하기 위해 연구팀은 2,717개의 경로 데이터를 포함하는 전용 고해상도 벤치마크를 구축했다. 각 경로에는 목표물 중심의 고수준 언어 지시문, 전면 및 하향 시점의 고해상도 자기중심 관찰 영상, 그리고 연속적인 3D 경유지 좌표 주석이 포함돼 있다.

From below of quadcopter with small propellers and motors flying in vibrant blue sky — 사진: Pok Rie / Pexels

성능 개선을 위해 제안된 프레임워크 3DG-VLN은 동적인 3D 방향 단서를 활용해 세밀한 시각적 그라운딩(grounding)과 공간 방향 정렬을 강화한다. 구체적으로 이 프레임워크는 전면 및 하향 카메라의 고해상도 영상을 적응적으로 처리해 목표물의 형태와 위치 정보를 정밀하게 유지하며, 폐루프 항법 과정에서 목표물과의 상대적 방향을 지속적으로 갱신한다. 이를 통해 드론이 장시간 비행하면서 발생하는 방향 오차 누적 문제를 줄일 수 있다. 실험 결과, 3DG-VLN은 기존 UAV-VLN 기준 모델들과 비교해 성공률을 13.82% 향상시켰다.

연구팀은 실세계 환경에서의 실증 시험도 수행해 3DG-VLN이 실용적인 드론 항법에 적용 가능함을 확인했다. 해당 연구의 소스 코드와 벤치마크 데이터셋은 공개 저장소(https://github.com/xuefanfu/3DG-VLN)에서 열람할 수 있다. 드론 자율 비행 기술이 배송, 탐색, 재난 구조 등 실용 분야로 확장되는 추세 속에서, 목표물 근거리 정밀 접근 능력의 체계적 평가와 개선은 상용화를 앞당기는 핵심 연구 과제로 주목받고 있다.