자연어로 물리 다이어그램 생성하는 PhyDrawGen 논문 공개

자연어로 작성된 물리 문제 설명을 입력받아 물리법칙을 준수하는 다이어그램을 자동 생성하는 신경-기호 파이프라인(neuro-symbolic pipeline) PhyDrawGen이 arXiv에 공개됐다(논문 번호 2605.30512). 기존 생성 모델들은 시각적으로 그럴듯한 이미지를 만들어도 힘 벡터를 임의로 추가하거나 보존 법칙을 위반하는 등 물리적 오류를 반복해 왔다. PhyDrawGen은 이 문제를 해결하기 위해 의미 파악 단계와 제약 조건 충족 단계를 분리하는 설계를 채택했다.

구체적으로 PhyDrawGen은 LLM(대규모 언어 모델)이 문제 텍스트에서 유형화된 장면 그래프(typed scene graph)를 추출하고, 결정론적 솔버가 이를 평면 직선 그래프(PSLG·Planar Straight-Line Graph)로 변환해 힘 균형·광경로·장 위상 등을 기하학적 기본 요소로 인코딩한다. 이후 파인튜닝된 Qwen-VL 모델이 시각적 검증 루프를 반복하며 제약 위반을 교정한다. 역학·광학·전자기학 분야 1,449개 문제로 구성된 벤치마크 테스트에서 PhyDrawGen은 GPT-5-image, 제미나이(Gemini) 2.5 Flash, 제미나이 3 Pro를 모두 앞서는 물리 정확도를 달성했다.

High-resolution close-up of detailed architectural blueprints showcasing precision design layouts. — 사진: Ivan S / Pexels

이 연구는 AI가 과학 문서·교재의 설명 다이어그램을 자동으로 생성하거나, 물리 교육 콘텐츠를 손쉽게 제작하는 데 활용될 수 있음을 보여준다. 순수 생성 모델과 달리 기호 추론을 결합해 물리법칙을 수치적으로 강제한다는 점에서, AI의 ‘환각(hallucination)’ 문제를 줄이는 신경-기호 접근법의 가능성을 교육·공학 분야에서 구체적으로 입증한 사례다. 국내 과학 교육 플랫폼과 디지털 교과서 개발사들도 유사한 방식의 다이어그램 자동 생성 기술 도입을 검토할 만하다.