도시 위성영상에서 녹지를 정밀하게 추출하는 딥러닝 모델 GMBFormer가 공개됐다. 초고해상도(UHR) 영상에서 녹지를 패치 단위로 처리할 때 공간적으로 분리된 유사 식생 패턴 간 의미 정보가 재활용되지 않는 기존 방식의 한계를 극복하기 위해 고안된 모델이다. SegFormer 아키텍처를 기반으로 하며, 인접성에 의존하는 기존 특징 전파 방식을 유사도 기반의 프로토타입 검색 방식으로 대체한 점이 핵심이다.
GMBFormer의 두드러진 특징은 NDVI(정규화 식생 지수)를 백본과 분리해 독립적인 물리 기반 게이트로 운용한다는 점이다. 백본과 디코더에는 RGB 채널만 입력되며, NDVI는 신뢰도가 높은 식생 특징 서술자를 선별해 소형 글로벌 메모리뱅크에 모멘텀 업데이트 방식으로 등록하는 역할만 담당한다. 학습과 추론 단계에서 현재 패치는 저장된 프로토타입을 메모리 매개 교차 어텐션(cross-attention)으로 조회하고, 검색된 응답을 최소한의 추가 연산으로 통합한다. 이로써 NDVI가 시각적 외형 학습과 뒤섞여 역할이 흐려지는 문제를 원천 차단했다.

실험은 연구팀이 자체 구축한 청두(Chengdu) UHR 데이터셋(512×512 픽셀 패치 7,700장 레이블 포함)과 공개 데이터셋인 ISPRS 포츠담(Potsdam)의 축소 레이블 설정 두 가지를 활용해 진행됐다. 동일 학습·평가 프로토콜 하에서 GMBFormer는 세 가지 설정에서 각각 mIoU(평균 교차합집합 비율)/mDice 89.25%/94.31%, 92.17%/95.92%, 83.72%/90.86%를 기록해 비교 기준 모델인 SegFormer-B4를 모든 설정에서 상회했다. 절제 실험(ablation study)을 통해 NDVI 분리 입력, 메모리 검색, 메모리 용량, 모멘텀 업데이트가 최종 성능에 각각 독립적으로 기여함이 확인됐다.
도시 녹지는 도심 열섬 완화, 탄소 흡수, 생태계 서비스 측면에서 중요성이 커지고 있어 정밀한 자동 매핑 수요가 높다. GMBFormer가 제안하는 글로벌 메모리뱅크 기반 프로토타입 검색 구조는 단일 도시 녹지 추출을 넘어 다양한 토지 피복 세분화 과제에도 적용될 수 있다는 점에서 추가 연구가 이어질 전망이다.














