• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

LLM이 만들어낸 ‘유령 인물’이 학술 저장소를 오염시킨다

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 04일 15시 29분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

대형 언어 모델(LLM)이 가상의 인물을 생성할 때 특정 이름 조합을 반복적으로 만들어내며, 이렇게 생성된 허구 인물들이 실제 학술 저장소와 웹 콘텐츠를 오염시키고 있다는 연구 결과가 발표됐다. 연구팀은 실존하지 않는 인물 엘레나 바스케스(Elena Vasquez)와 마커스 첸(Marcus Chen)이 AI가 독립적으로 생성한 수백 건의 문서에서 화산 전문가, 우주비행사, 소설 주인공, 팟캐스트 진행자, 학술 공저자 등 다양한 역할로 등장한다는 사실을 확인했다.

연구에 따르면 LLM은 단순히 확률이 높은 개별 이름을 선택하는 것이 아니라, 특정 인물 쌍이나 트리오가 함께 등장하는 상관 앙상블을 생성한다. 이 공출현 빈도는 우연 수준을 크게 초과하며 독립적인 생성 세션에서도 일관되게 나타난다. 이러한 이름 선호 패턴은 모델 계열에 따라 다르게 나타났다. 클로드(Claude)는 엘레나 바스케스·마커스 첸·아마라 오카포(Amara Okafor) 조합을, 제미나이(Gemini)는 아리스 손·레나 페트로바 조합을, GPT는 엘라라 보스를 고정 파트너 없이 선호했으며, 이 패턴은 모델 출시 버전에 따라 달라져 콘텐츠 생성 시기를 추정할 수 있는 행동 지문(behavioral fingerprint)으로 기능한다.

이러한 허구 인물들이 남긴 피해는 측정 가능한 규모로 확인됐다. CERN이 운영하는 데이터 저장소 Zenodo에서 존재하지 않는 학술지와 조작된 출판 날짜를 기재한 허위 기록 1,655건이 발견됐다. 저장소 서버 측 타임스탬프는 이 기록들이 의도적으로 날짜를 소급 기재했음을 증명하며, 그중 991건이 단 한 달 만에 등록됐다. 이 기록들은 DataCite에 실제 DOI(디지털 객체 식별자)가 부여돼 있어 DOI 메타데이터를 수집하는 학술 집계 서비스에 그대로 유입될 수 있다. 연구게이트(ResearchGate)에서도 여러 모델 계열의 허구 인물이 합성 연구 그룹을 형성하고 있는 것이 관찰됐다.

이번 연구는 AI 생성 콘텐츠가 학술 인프라에 미치는 구체적 위협을 수치로 제시했다는 점에서 주목받는다. 실제 DOI가 부여된 허위 기록은 학술 검색 엔진과 인용 데이터베이스의 신뢰성을 직접 훼손할 수 있으며, 모델이 특정 이름 패턴을 반복 생성한다는 사실은 AI 출력물의 감지 및 필터링에 새로운 단서를 제공한다. 연구팀은 이 패턴이 모델 배포 시점을 추정하는 시간적 프록시로도 활용될 수 있다고 밝혔다.

Tags: AI생성콘텐츠AI안전LLM학술출판허위정보
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

From below of fiber optic switch with sockets and connected rubber cables on blurred background
AI 모델·연구

중력 방향 인식 계층적 라우팅으로 경량 웨어러블 AI의 정적 동작 인식 개선

2026년 06월 05일 15시 00분
Detailed view of a scientist operating a microscope in a laboratory setting.
AI 모델·연구

OpenAI, AI 기반 생물학적 방어 액션플랜 공개…GPT-Rosalind 활용

2026년 06월 05일 14시 59분
Detailed view of a circuit board showcasing intricate patterns and metallic connections.
AI 모델·연구

뇌 기반 파운데이션 모델, 3차 통계 결여가 인지 예측 성능 저하 원인

2026년 06월 05일 14시 52분
A doctor stands beside a patient in an MRI room, ensuring a smooth examination process.
AI 모델·연구

딥러닝 이표본 검정에 반사실적 설명을 결합한 새 방법론

2026년 06월 05일 14시 43분
Next Post
Stunning aerial photo of Bangladesh's patchwork rice fields from above, showcasing vibrant greenery.

경량 트랜스포머 LALE, 원격탐사 토지피복 분류 효율 혁신

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
From below of fiber optic switch with sockets and connected rubber cables on blurred background

클라우드플레어 CEO ‘봇이 인터넷 트래픽 57% 돌파, 크롤링 유료화 불가피’

2026년 06월 05일 15시 11분
A 3D rendering of a neural network with abstract neuron connections in soft colors.

오픈AI, ChatGPT 메모리 아키텍처 전면 개편…무료 사용자도 기억 기능 제공

2026년 06월 05일 15시 07분
A view of the historical Parliament Hill building in Ottawa against a clear sky.

캐나다, ‘AI for All’ 국가 AI 전략 발표…산업 육성·규제 병행

2026년 06월 05일 15시 03분
From below of fiber optic switch with sockets and connected rubber cables on blurred background

중력 방향 인식 계층적 라우팅으로 경량 웨어러블 AI의 정적 동작 인식 개선

2026년 06월 05일 15시 00분
Detailed view of a scientist operating a microscope in a laboratory setting.

OpenAI, AI 기반 생물학적 방어 액션플랜 공개…GPT-Rosalind 활용

2026년 06월 05일 14시 59분

검색

No Result
View All Result

인기 태그

AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI 허깅페이스

카테고리

  • AI 모델·연구 (268)
  • AI 서비스·툴 (118)
  • 반도체·인프라 (125)
  • 빅테크·기업 (116)
  • 산업 적용 (96)
  • 스타트업·투자 (67)
  • 정책·윤리 (114)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI 허깅페이스

최근 뉴스

From below of fiber optic switch with sockets and connected rubber cables on blurred background

클라우드플레어 CEO ‘봇이 인터넷 트래픽 57% 돌파, 크롤링 유료화 불가피’

2026년 06월 05일 15시 11분
A 3D rendering of a neural network with abstract neuron connections in soft colors.

오픈AI, ChatGPT 메모리 아키텍처 전면 개편…무료 사용자도 기억 기능 제공

2026년 06월 05일 15시 07분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.