미국의 유력 매체 더애틀랜틱(The Atlantic)이 AI 음악 모델 훈련에 사용된 음원 데이터를 정리한 검색 가능한 데이터베이스 4종을 공개했다. 데이터베이스 규모는 상당하다. 가장 큰 것은 1,200만 곡, 두 번째는 900만 곡을 담고 있으며, 나머지 두 개는 각각 약 10만 곡으로 구성돼 있다. 더애틀랜틱 소속 작가 알렉스 라이스너(Alex Reisner)가 작성한 동반 기사는 테일러 스위프트(Taylor Swift), 배드 버니(Bad Bunny) 등 세계적인 아티스트의 히트 음원을 포함해 저작권이 보호되는 음악이 AI 훈련에 대규모로 활용된 정황을 상세히 기술하고 있다.
이번 조사 결과는 생성 AI 음악 플랫폼을 상대로 진행 중인 법적 분쟁에 직접적인 영향을 미칠 수 있다. 수노(Suno)와 우디오(Udio) 등 AI 음악 생성 플랫폼은 저작권 보호 콘텐츠를 무단으로 수집해 플랫폼 구동에 활용했다는 혐의로 법적 절차를 밟고 있다. 이들 플랫폼은 공정 이용(fair use) 원칙을 주요 방어 논거로 내세워왔다. 이와 유사한 책 출판 분야의 소송에서는 저작권 침해 주장이 판사의 지지를 얻지 못했으나, 불법 복제 혐의가 보다 설득력 있는 법적 근거로 작용한 사례가 있다. 해당 소송의 최종 배상액은 아직 결정되지 않았지만, 초기 합의금은 15억 달러로 알려졌다. 더애틀랜틱의 데이터베이스는 음악 업계가 유사한 소송을 추진할 때 구체적인 근거 자료로 활용될 가능성이 높다.
AI 생성 음악에 대한 업계의 대응도 진행 중이나 효과는 엇갈린다. 주요 음악 스트리밍 서비스들은 AI 생성 창작물을 방지하거나 식별·표기하는 조치를 도입하고 있다. 그러나 이러한 노력이 일관된 성과를 거두지 못하고 있으며, 기존 밴드와 유사한 AI 복제 음원을 생성해 수익을 노리는 사기성 시도도 차단하지 못하고 있다. AI 기술이 창작 영역에 깊숙이 침투하면서 저작권법의 기존 틀이 충분하지 않다는 인식이 확산되고 있으며, 이번 더애틀랜틱의 조사는 음악 업계와 AI 기업 간 갈등이 법정 밖에서도 공론화되고 있음을 보여준다. 훈련 데이터의 투명성과 저작권자 보상 체계를 둘러싼 논의가 AI 산업 전반으로 확산될 것으로 전망된다.














