위성·항공 영상에서 해안선을 추출하는 기존 연구는 대부분 픽셀 단위 분할(segmentation) 문제로 접근해 왔다. 이 방식에서는 예측된 마스크에서 후처리를 통해 해안선을 추출하는데, 해안 변화 분석에서 핵심 표현인 해안선 기하학 자체가 학습 목표가 아닌 부산물로 밀려난다는 근본적 문제가 있다. 연구진은 이 패러다임을 벗어나 해안선 추출을 기하학적 경계 국소화 과제로 재정의하고, 비전-언어 모델(VLM)을 활용한 새로운 접근법을 제시했다.
연구진은 뉴질랜드 해안 변화 데이터셋(NZCCD)과 뉴질랜드 토지정보국(LINZ)의 고해상도 항공 영상을 활용해 CoastlineVLM-7B를 개발했다. 이 모델은 GeoChat-7B/LLaVA-1.5 아키텍처를 기반으로 해안선 존재 감지, 프록시 유형 분류, 해안선 위치 지정을 동시에 수행하며, 밀집 분할 마스크 대신 폴리라인(polyline) 형태로 해안선을 직접 예측한다. 실제 해안선은 식생선, 사구 발끝, 절벽 가장자리 같은 지형적 프록시로 정의되는데, 이는 기존 픽셀 기반 방법이 사용하는 육지-수면 경계와는 다른 개념이다.

엄격한 1픽셀 경계 감독 조건에서 분할 베이스라인과 비교한 결과, CoastlineVLM-7B는 하우스도르프 거리(Hausdorff distance)를 37.74m에서 31.84m로, 지구 이동 거리(Earth Mover’s Distance)를 21.12m에서 17.32m로 줄이며 기하학적 정렬 성능을 높였다. 연구진은 IoU와 같은 픽셀 중첩 지표보다 기하 기반 지표가 해안선 품질을 평가하는 데 더 적합하다고 강조하며, 출력 표현 방식이 해안선 추출 모델 설계의 핵심 선택임을 시사했다. 이 연구 결과는 VLM의 의미적 추론 능력과 기하 지향 학습의 결합이 실용적 해안 모니터링 시스템에서 어떻게 정의되고 평가되는지에 잘 부합함을 보여준다.














