인간 이동 궤적에서 이상 패턴을 연구하는 데 있어 가장 큰 장애물은 주석이 달린 이상 데이터셋의 부재다. 실제 수집된 궤적 데이터들은 정상 이동만 담고 있어 이상 탐지 모델 개발에 활용하기 어렵고, 이상 사건의 통계적 희소성과 대규모 이동 데이터 수집에 따른 높은 비용 및 개인정보 규제가 이 문제를 더욱 심화시킨다. 연구팀은 이 공백을 채우기 위해 LLM(대규모 언어 모델) 에이전트를 활용한 엔드투엔드 궤적 이상 합성 프레임워크를 제안했다.
이 프레임워크는 기존 시뮬레이션 기반 정상 궤적에 직접 작동하며, LLM 에이전트가 비정상적인 외부 체크인이나 일상 방문 누락 같은 의미론적 이상 행동을 체계적으로 주입한다. 물리적 이동의 현실성을 보장하기 위해 지도 제약 경로 재구성 방식을 적용해 LLM 에이전트가 수정한 체류지점 사이의 실제 이동 경로를 재계산한다. 이를 통해 순수 합성 데이터가 실제 물리 환경 제약을 무시하는 문제를 극복했다.
시뮬레이션과 현실 사이의 간극을 좁히기 위해 환경 및 위치별 변수로 파라미터화된 문맥 인식 공간 노이즈 모델도 함께 적용한다. 이는 이기종 GPS 센서 품질 저하를 현실적으로 모사하는 역할을 한다. 연구팀은 이 접근법이 주석이 달린 이상 지상 진실(ground truth) 데이터셋을 대규모로 생성하는 실용적 수단이 될 수 있다고 설명했다.
이 연구는 이상 행동 탐지, 위치 기반 보안, 도시 이동 패턴 분석 등 다양한 응용 분야에서 학습 데이터 부족 문제를 해소하는 데 기여할 것으로 기대된다. LLM의 상식 추론 능력을 합성 데이터 생성에 결합하는 방식은 데이터 희소성 문제를 안고 있는 다른 도메인으로의 확장 가능성도 제시한다.














