DyNACO, 동적 신경 유도로 대규모 개미 군집 최적화 성능 향상

신경망으로 유도된 개미 군집 최적화(ACO, Ant Colony Optimization) 방법들이 갖는 근본적인 문제인 훈련-추론 불일치를 해결하는 새 프레임워크 DyNACO가 발표됐다. 기존 신경 유도 ACO는 정책이 정적 사전 정보(예: 히트맵)를 생성하도록 훈련되지만, 실제 추론 단계에서는 반복적이고 장기 탐색 과정을 유도하는 데 쓰인다. 이 훈련과 추론 간의 불일치가 성능 저하로 이어진다는 것이 연구팀의 진단이다.

DyNACO는 이 문제를 페로몬 분포(pheromone distribution)와 현재 최적해를 주기적으로 관찰하여 동적으로 유도 신호를 갱신하는 방식으로 접근했다. 대규모 인스턴스에서의 실용성을 위해 섭동 기반 ACO 백엔드와 탐색 범위를 제한하는 정제 메커니즘을 결합해 효율성과 안정적인 크레딧 할당을 함께 확보했다. TSP(외판원 문제)에서 100,000 노드 규모의 인스턴스까지 확장하면서도 기존 신경 기반 방법들을 능가했으며, 비유도 해법 대비 전체 실행 시간을 줄이는 경우도 있었다고 연구팀은 밝혔다. CVRP(용량 제한 차량 경로 문제)로도 확장해, 용량 인식 백엔드를 통해 신경 오버헤드 1% 미만으로 비유도 기준선을 꾸준히 개선했다.

Close-up view of a bustling anthill with many ants moving actively across the surface. — 사진: Petr Ganaj / Pexels

연구팀은 추가 분석을 통해 DyNACO의 일반화 능력과 동적 유도가 정적 사전 정보보다 뛰어난 이유를 상세히 설명했다. 이 결과는 학습 유도 최적화에서 신경망 훈련이 실제 반복적 탐색 역학과 일치하도록 설계되어야 한다는 점을 강조하며, 동적 신경 유도가 대규모 조합 최적화 문제에서 실질적인 해법이 될 수 있음을 보여준다.

물류 경로 최적화, 스케줄링, 네트워크 설계 등 대규모 조합 최적화가 필요한 산업 영역에서 LLM 이후 AI 응용의 한 축으로 신경 최적화 방법이 주목받고 있다. DyNACO는 이 분야에서 훈련-추론 불일치라는 오랜 제약을 정면으로 다룬 접근으로 평가되며, 코드도 공개돼 후속 연구의 기반이 될 전망이다.