광학 음악 인식(OMR, Optical Music Recognition)은 인쇄된 악보나 필사본 이미지에서 음악 표기를 자동으로 판독하는 기술이다. 최근 엔드투엔드 방식의 발전으로 복잡한 표기까지 인식하는 수준에 도달했지만, 이 기술의 실질적 효과는 학습 데이터의 시각적 도메인에 제한돼 있다는 문제가 있다. 현재 공개된 대형 악보 데이터셋 대부분은 컴퓨터로 생성된 디지털 악보여서, 도서관과 문화유산 기관이 소장한 다양하고 불균일한 필사본 악보에 기존 시스템을 적용하면 성능이 크게 떨어진다.
연구진은 자원이 제한된 환경에서 복잡한 피아노 표기를 포함한 실제 필사본에 대한 최초의 기준 성능을 제시했다. 핵심 방법은 세밀한 음악 표기 그래프(MuNG, Music Notation Graph) 어노테이션과 스매시시마(Smashcima) 합성 도구를 결합한 도메인 적응이다. 실험 결과 실내 도메인 데이터 일부는 여전히 필요하지만, 합성 필사본 이미지를 활용한 도메인 적응이 유의미한 성능 향상을 가져옴이 확인됐다. 또한 합성에 사용하는 기호가 반드시 실내 도메인 기호일 필요는 없어, 비용이 많이 드는 세밀한 어노테이션 작업을 피할 수 있다는 점도 밝혔다.

이 연구는 OMR 분야가 표방해 온 핵심 목표, 즉 음악 문화유산의 보존과 접근성 향상에 가까이 다가선 성과로 평가된다. 도서관과 문화 기관은 대규모 인도메인 데이터셋 구축이 현실적으로 어렵기 때문에, 합성 데이터 기반 도메인 적응이 효과적인 대안으로 부상하고 있다. 이 방법이 확산되면 세계 각지에 보존된 역사적 악보 필사본을 더 쉽게 디지털화하고 연구자와 대중에게 공개하는 데 기여할 수 있을 것으로 보인다.














