국가유산청이 창덕궁·덕수궁·창경궁 등 고궁 관련 데이터 최대 30만 건을 AI 학습에 특화된 형태로 재구성하는 사업에 착수한다. 고궁 관련 보고서, 이미지, 영상, 음원 같은 문화유산 데이터와 궁궐 주변 관광명소, 숙박시설, 교통 정보, 음식점, 문화시설 정보를 융합한 데이터셋을 구축하는 것이 핵심이다. 국가유산청은 이달 중 사업자 입찰을 진행해 연내 데이터 융합 체계를 완성한다는 방침이다.
이번 사업의 목적은 단순한 데이터 디지털화를 넘어 AI 리더블(AI-readable) 데이터로의 전환에 있다. 출처가 명확하고 검증된 고품질 데이터를 확보해 국내외에서 AI 학습에 폭넓게 활용 가능한 국가유산 데이터 기반을 마련하는 것이 목표다. 완성된 데이터셋은 국가유산포털과 네이버 같은 국내 포털은 물론, 글로벌 AI 오픈소스 플랫폼 허깅페이스(Hugging Face)에도 공개될 예정이다. 저작권 제약 없이 활용할 수 있는 형태로 제공해 콘텐츠 창작 생태계 활성화에도 기여하겠다는 구상이다.
K-팝·K-콘텐츠 확산으로 한국 문화에 대한 해외 관심이 높아지는 가운데, 글로벌 생성형 AI 플랫폼에서 국가유산에 대한 왜곡된 정보가 무분별하게 생성·확산되는 문제가 배경으로 작용했다. 신뢰할 수 있는 1차 출처 기반의 AI 학습 데이터를 정비해 오류 콘텐츠 확산을 사전에 차단하겠다는 의도다. 국가유산청은 민관 협업을 통한 AI 데이터 개방·활용 생태계 조성에 기여하겠다는 입장을 밝혔다. 공공기관이 보유한 문화유산 데이터를 AI 학습에 적합한 형태로 구조화해 개방하는 사례가 쌓이면, 문화 분야 AI 서비스의 품질과 신뢰도를 높이는 데 긍정적으로 작용할 것으로 기대된다. 데이터 가공과 데이터셋 구축은 데이터 전처리에 특화된 전문 기업이 담당하며, 국가유산청은 이달 중 사업자 모집과 입찰을 거쳐 연내 융합 체계를 마무리한다는 계획이다. 신뢰할 수 있는 1차 출처 데이터가 글로벌 오픈소스 플랫폼에 쌓이는 것은 한국 문화유산이 생성형 AI의 학습 단계부터 정확하게 반영되도록 하는 기반이라는 점에서, 단순 디지털화 사업을 넘어선 의미를 갖는다.














