생성 AI 시대 멀티모달 가짜뉴스 탐지, 갈등 추론 기반 CORE 제안

생성형 AI(인공지능)의 확산으로 텍스트와 이미지를 결합한 멀티모달 허위 정보가 빠르게 퍼지는 가운데, 이를 탐지하는 새로운 프레임워크 CORE(Conflict-Oriented REasoning)가 arXiv에 등재됐다. 선(Shen) 등 연구진이 2026년 6월 2일 공개한 논문은 조작된 허위 정보의 핵심이 모달리티 간 또는 상식과의 의미적·물리적 충돌에 있다는 관찰에서 출발한다.

기존 탐지 방법들은 특정 조작 유형에 맞춘 모델과 대규모 레이블 데이터에 의존하기 때문에 새로운 조작 방식이 등장했을 때 일반화 성능이 떨어진다는 한계가 있었다. CORE는 이 문제를 해결하기 위해 MLLM(멀티모달 대규모 언어 모델)에 충돌 포착 능력을 명시적으로 부여하는 방식을 취한다. 프레임워크는 먼저 충돌 요인과 출처를 세밀하게 주석으로 달아 구성한 충돌 귀인 코퍼스(Conflict Attribution Corpus, CAC)를 구축하고, 이를 기반으로 충돌 지향 표현 강화 및 추론 훈련을 수행한다. 연구진은 광범위한 실험을 통해 CORE가 최신 비교 모델들을 앞질렀다고 밝혔으며, 소량 샘플(few-shot) 또는 제로샷(zero-shot) 설정에서도 새로운 조작 유형에 빠르게 적응할 수 있음을 확인했다. 데이터셋과 코드는 공개됐다.

멀티모달 콘텐츠 생성 기술이 고도화될수록 기존 탐지 모델의 수명은 짧아지고, 레이블 수집 비용은 커진다는 점에서 범용 탐지 프레임워크의 필요성은 지속적으로 커지고 있다. 충돌 자체를 탐지 신호로 삼는 접근은 조작 유형에 구애받지 않는다는 이론적 장점이 있으며, 실제 플랫폼 적용 가능성 측면에서 후속 연구가 주목될 것으로 보인다. 논문 전문과 데이터셋은 arXiv(arxiv.org/abs/2606.03066)에서 확인할 수 있다.