city2graph, OSMnx, PyTorch Geometric(PyG)을 결합해 실제 도시 관심지점(POI) 데이터를 공간 그래프로 변환하고, 그래프 신경망(GNN)으로 도시 기능을 추론하는 완전한 파이프라인 구현 방법이 공개됐다. 해당 파이프라인은 OpenStreetMap에서 음식점, 소매점, 교육기관, 의료시설 등 4개 범주의 POI 데이터를 수집하고, OSM 접근이 불가한 환경을 위한 합성 데이터 폴백(fallback) 기능까지 갖춰 재현성을 높였다.
파이프라인은 크게 다섯 단계로 구성된다. 먼저 도쿄 시부야 인근을 기준으로 OSMnx를 통해 POI와 도로망 데이터를 수집한 뒤, 각 지점의 좌표·국지 밀도·도로까지 거리 등 공간 피처(feature)를 엔지니어링한다. 이어 KNN, 들로네(Delaunay), 가브리엘(Gabriel), RNG, EMST, 왁스만(Waxman) 등 여섯 가지 근접 그래프 패밀리를 구성하고 엣지 수와 평균 차수를 비교한다. 동일한 POI 집합이 그래프 구성 방식에 따라 얼마나 다르게 연결되는지를 시각적으로 확인할 수 있다는 점이 이 단계의 핵심이다.
그래프 데이터는 PyG의 HeteroData 형식과 동질 그래프(homogeneous graph) 두 가지로 변환된다. 이종(異種) 그래프에서는 도시 기능 범주별로 노드 유형을 분리한 뒤 브리지 엣지로 레이어 간 연결을 구성하며, 동질 그래프에서는 KNN k=8 구성에 차수(degree) 피처를 추가해 StandardScaler로 정규화한다. 이후 2층 구조의 GraphSAGE 모델을 200 에포크(epoch) 동안 학습시켜 훈련·검증·테스트 마스크 기준으로 POI 범주 분류 성능을 평가한다. 학습된 임베딩은 PCA로 2차원 축소해 클래스별 군집화 양상을 시각화하고, 지리 좌표에 예측 결과를 다시 매핑함으로써 모델이 공간 구조에서 도시 기능을 얼마나 잘 분리해 내는지 직관적으로 확인할 수 있다.
이 파이프라인은 OSM 데이터 수집, 그래프 구축, GNN 기반 공간 추론을 단일 Colab 호환 워크플로로 통합한 점에서 지리공간 머신러닝 연구와 스마트시티 응용에 실용적인 참고 구현체가 된다. city2graph가 원시 도시 데이터를 그래프로 전환하는 인터페이스를 제공하고, GeoPandas와 PyG가 각각 지리 데이터 처리와 딥러닝 학습을 담당하는 역할 분리 구조 덕분에, 새로운 도시 환경이나 추가 POI 범주에도 비교적 쉽게 확장 적용할 수 있다는 평가다.














