VeriGeo, 검증 기반 기하 문제 자동 생성 프레임워크 제안

AI 보조 교육과 다중모달 수학 추론을 위한 기하 문제 자동 생성 연구가 arXiv에 공개됐다(논문 번호 2606.14176, 2026년 6월 12일 제출). 연구팀이 제안한 VeriGeo는 사용자가 지정한 개념·난이도 등의 조건을 입력받아 문제 진술, 다이어그램, 제약 조건, 풀이를 상호 일관되게 생성하는 제어 가능한 기하 생성 프레임워크다. 기존 방법들은 제어 유연성과 검증 신뢰성 사이에서 상충 관계가 있었으나, VeriGeo는 실행 가능한 추론 흔적(reasoning trace)에 기반해 이 문제를 해결하고자 한다.

VeriGeo는 두 에이전트의 협업 구조로 동작한다. 저자 에이전트(Author agent)가 문제와 다이어그램을 생성하면, 풀이 에이전트(Solver agent)가 증명과 정렬된 풀이를 만들어낸다. 두 에이전트는 자연어·다이어그램·기하 제약·증명 단계를 하나의 검증 가능한 표현으로 연결하는 공유 행동 시퀀스를 사용한다. 생성된 문제는 수치 일관성, 분석적 실현 가능성, 전역 일관성을 순서대로 점검하는 3단계 파이프라인을 통과하며, 복구 가능한 오류는 검증 유도 반성(verification-guided reflection)으로 수정하고 복구 불가능한 경우는 제외한다.

다섯 가지 LLM 백본을 대상으로 한 실험에서, 검증 없이 생성한 원본 결과물은 일관성 검사를 자주 통과하지 못한 반면 VeriGeo는 부적합 생성물의 상당 비율을 수정하는 데 성공했다. VeriGeo로 생성한 8,700여 건의 예시로 지도 미세 조정을 수행하면 종단간 다중모달 LLM 기반 풀이 중 GeoQA에서 최고 성능을 기록했으며, PGPS9K와 MathVista-GPS에서도 높은 결과를 얻었다. 연구팀은 이 결과가 검증된 합성 데이터가 다중모달 기하 추론 향상에 실질적으로 기여함을 보여준다고 밝혔다.

이번 연구는 AI 교육 분야에서 고품질 수학 문제를 자동으로 대량 생성하려는 흐름을 보여준다. 기하 문제는 텍스트와 그림이 동시에 일관돼야 한다는 점에서 단순 텍스트 생성보다 까다롭다. 생성과 검증을 하나의 파이프라인으로 통합하는 VeriGeo의 접근 방식은 수학 교육 콘텐츠 자동화나 다중모달 추론 연구 데이터 확보에 실용적 경로를 제시한다는 평가를 받을 수 있다.