번체 중국어 특수교육 IEP 자동 생성 AI…GPT 등 제로샷 모델 성능 초과

개별화 교육 계획(IEP, Individualized Education Program)은 특수 교육 현장에서 학생 한 명 한 명에 맞춰 작성해야 하는 고부담 문서다. 영어권에서는 생성 AI가 초안 작성 시간을 대폭 줄인다는 연구가 이어졌지만, 번체 중국어 환경에서는 도메인 데이터 부족·엄격한 개인정보 규정·현지 평가 기준 부재로 자동화 연구가 거의 없었다. 연구진은 이 공백을 메우기 위해 코퍼스 기반 특성 확산(CGFD, Corpus-Grounded Feature Diffusion)을 핵심으로 한 저자원 미세 조정 파이프라인을 제안했다.

파이프라인은 전문가가 선별한 25개 고득점 시드 전사본을 기반으로 문장 길이·구조·수량화 템플릿 등 특성 프로파일을 추출하고, 이를 LLM(대규모 언어 모델) 프롬프트에 주입해 582개 학습 샘플을 확산 생성했다. 이 데이터로 Breeze-7B 모델을 QLoRA(저순위 적응) 방식으로 미세 조정했다. 추론 단계에서는 계층적 SMART 목표 체계 준수를 강제하는 문법 제약 디코딩(GCD)을 도입했으나, 번체 중국어 토큰 예산 조건에서 GCD가 오히려 역효과를 낸다는 예상치 못한 결과가 나왔다. GCD 없는 경로가 스키마 통과율 100%에 중앙값 지연 34% 감소라는 더 나은 성능을 보였다.

Close-up of a professional meeting setup with hands, laptops, and notebooks on a wooden desk. — 사진: Pixabay / Pexels

10개 샘플 공식 검증 세트에서 GCD 미적용 경로의 BERTScore F1은 0.779로 측정됐다. 이는 GPT-5.4(0.726), DeepSeek-V3.2(0.703), Gemini-3-Flash-Preview(0.703), Llama-4-Maverick(0.700) 등 대형 모델의 제로샷 기준값을 모두 웃도는 수치다. 이 시스템은 완전 로컬·에어갭(외부망 차단) 환경에서 동작해 개인정보 보호 요건을 충족한다. 연구진은 번체 중국어 특수 교육 자연어 처리 분야의 공백을 채우면서 개인정보 보호와 확장성을 동시에 달성하는 로컬 추론 솔루션을 제시했다고 밝혔다.