소수의 참조 글자만으로 새 폰트 전체를 만드는 퓨샷(few-shot) 폰트 생성 분야에서, 전역적 구조 완성도와 세밀한 로컬 스타일 충실도를 동시에 달성하는 확산(diffusion) 모델 기반 프레임워크 SmartFont가 arxiv에 공개됐다. 기존 방법들이 두 가지 목표 사이에서 절충해야 했던 한계를 극복하는 데 초점을 맞췄다.
기존 퓨샷 폰트 생성 접근법은 크게 두 방향으로 나뉜다. 전역 콘텐츠-스타일 모델링에 의존하는 방식은 견고하지만 분리가 불완전하고, 컴포넌트·로컬 모델링에 집중하는 방식은 세부 묘사를 잘 포착하지만 로컬 사전 지식과 참조 범위에 크게 의존한다. SmartFont는 이 두 방향이 상호 보완적이면서도 편향을 가진 조건임을 인식하고, 생성 과정 전반에 걸쳐 다단계 할당으로 이를 조율하는 것이 핵심 과제라고 제안한다.
SmartFont는 전역 콘텐츠-스타일 생성과 약지도(weakly supervised) 로컬 교정 전문가를 결합한 구조다. 로컬 분기는 전문가별 로컬 개념과 의미론적 공간 맵을 학습해, 명시적인 컴포넌트 조건 추론 없이도 세밀한 교정이 가능하다. 이 위에서 노이즈 제거 상태별 조건 할당 모듈이 각 타임스텝과 주입 블록에 걸쳐 전역 콘텐츠, 전역 스타일, 로컬 교정 특성의 가중치를 적응적으로 조정한다. 실험 결과 SmartFont는 글자 품질과 로컬 세부 충실도에서 개선을 달성했다고 논문은 밝혔다.
퓨샷 폰트 생성은 한자나 한글처럼 수천 자에 달하는 문자 체계에서 특히 실용적 가치가 크다. 소수 참조만으로 전체 폰트를 자동 완성할 수 있다면 폰트 제작 비용을 크게 낮출 수 있기 때문이다. SmartFont의 다단계 조건 할당 방식은 이 분야 연구의 새로운 방향을 제시하며, 향후 다양한 문자 체계와 스타일로의 확장 가능성도 열려 있다.














