진화 기반 프로그램 합성 기법인 유전 프로그래밍(GP)의 핵심 탐색 방식을 재설계한 ‘최소주의 유전 프로그래밍(MGP, Minimalist Genetic Programming)’이 2026년 6월 8일 arXiv에 제안됐다. 이 알고리즘은 기존 GP가 채택하는 진화적 탐색 대신, 노엄 촘스키(Noam Chomsky)의 인간 언어 최소주의 프로그램에서 영감을 얻은 구문 도출 방식을 기반으로 한다. 생물학적 영감을 공유하면서도 탐색 메커니즘 자체를 근본적으로 바꾼 시도라는 점에서 주목받는다.
전통적인 GP는 학습 과제를 프로그램 귀납 문제로 정식화하고, 구문 트리로 표현된 모델을 진화 알고리즘으로 탐색한다. MGP는 이 탐색 방식을 변경해 문제를 구문적 도출 과제로 재정의한다. 최소주의 프로그램의 핵심 연산인 이진 집합 형성 연산자 MERGE를 활용해 마르코프 과정으로 복잡한 구문 구조를 점진적으로 구성하는 것이 핵심 메커니즘이다. MGP는 이를 통해 상징 표현식의 핵심 구성 요소를 발견하고 이를 점진적으로 결합함으로써, 단순한 이진 연산만으로도 복잡한 수식 공간을 효율적으로 탐색한다.
연구팀은 MGP를 표준 GP 시스템이 풀기 어려운 것으로 알려진 기호 회귀(symbolic regression) 과제에서 벤치마크했다. 표준 GP의 주요 약점인 코드 비대화(bloat) 문제가 특히 두드러지는 과제들에서, 적절한 원자 구문 객체 어휘가 선택됐을 때 MGP가 정확한 기저 모델을 일관되게 도출해낸 반면 표준 GP는 그러지 못했다고 연구팀은 밝혔다. 코드 비대화는 GP에서 진화 과정이 진행될수록 프로그램이 불필요하게 길어지고 해석하기 어려워지는 고질적인 문제다.
이 연구는 언어학의 통찰이 프로그램 귀납 문제에도 유효하다는 가능성을 실험적으로 입증했다. 단순하고 범용적인 이진 합성 연산으로 복잡한 수식 구조를 효율적으로 탐색할 수 있다는 가능성은 기호 회귀를 비롯한 과학적 방정식 발견 연구, 그리고 설명 가능한 AI 모델 구축에 새로운 방향을 제시한다.














