LLM이 만들어낸 '유령 인물'이 학술 저장소를 오염시킨다

LLM이 만들어낸 ‘유령 인물’이 학술 저장소를 오염시킨다

대형 언어 모델(LLM)이 가상의 인물을 생성할 때 특정 이름 조합을 반복적으로 만들어내며, 이렇게 생성된 허구 인물들이 실제 학술 저장소와 웹 콘텐츠를 오염시키고 있다는 연구 결과가 발표됐다. 연구팀은 실존하지 않는 인물 엘레나 바스케스(Elena Vasquez)와 마커스 첸(Marcus Chen)이 AI가 독립적으로 생성한 수백 건의 문서에서 화산 전문가, 우주비행사, 소설 주인공, 팟캐스트 진행자, 학술 공저자 등 다양한 역할로 등장한다는 사실을 확인했다.

연구에 따르면 LLM은 단순히 확률이 높은 개별 이름을 선택하는 것이 아니라, 특정 인물 쌍이나 트리오가 함께 등장하는 상관 앙상블을 생성한다. 이 공출현 빈도는 우연 수준을 크게 초과하며 독립적인 생성 세션에서도 일관되게 나타난다. 이러한 이름 선호 패턴은 모델 계열에 따라 다르게 나타났다. 클로드(Claude)는 엘레나 바스케스·마커스 첸·아마라 오카포(Amara Okafor) 조합을, 제미나이(Gemini)는 아리스 손·레나 페트로바 조합을, GPT는 엘라라 보스를 고정 파트너 없이 선호했으며, 이 패턴은 모델 출시 버전에 따라 달라져 콘텐츠 생성 시기를 추정할 수 있는 행동 지문(behavioral fingerprint)으로 기능한다.

이러한 허구 인물들이 남긴 피해는 측정 가능한 규모로 확인됐다. CERN이 운영하는 데이터 저장소 Zenodo에서 존재하지 않는 학술지와 조작된 출판 날짜를 기재한 허위 기록 1,655건이 발견됐다. 저장소 서버 측 타임스탬프는 이 기록들이 의도적으로 날짜를 소급 기재했음을 증명하며, 그중 991건이 단 한 달 만에 등록됐다. 이 기록들은 DataCite에 실제 DOI(디지털 객체 식별자)가 부여돼 있어 DOI 메타데이터를 수집하는 학술 집계 서비스에 그대로 유입될 수 있다. 연구게이트(ResearchGate)에서도 여러 모델 계열의 허구 인물이 합성 연구 그룹을 형성하고 있는 것이 관찰됐다.

이번 연구는 AI 생성 콘텐츠가 학술 인프라에 미치는 구체적 위협을 수치로 제시했다는 점에서 주목받는다. 실제 DOI가 부여된 허위 기록은 학술 검색 엔진과 인용 데이터베이스의 신뢰성을 직접 훼손할 수 있으며, 모델이 특정 이름 패턴을 반복 생성한다는 사실은 AI 출력물의 감지 및 필터링에 새로운 단서를 제공한다. 연구팀은 이 패턴이 모델 배포 시점을 추정하는 시간적 프록시로도 활용될 수 있다고 밝혔다.