Data2Story, CSV 파일 하나로 7개 AI 에이전트가 검증된 인터랙티브 기사 자동 생성

옥스퍼드대와 스탠퍼드대 연구진이 데이터 파일 하나를 완성된 인터랙티브 기사로 바꾸는 AI 파이프라인 ‘Data2Story’를 개발했다. 클로드 코드(Claude Code) 스킬 형태로 구성된 이 시스템은 CSV 파일을 입력받아 7개의 전문화된 AI 에이전트가 역할을 나눠 리서치·통계 분석·시각화·출처 검증까지 수행한 뒤 완성된 웹 기사를 출력한다. 연구진은 시스템을 2026 FIFA 월드컵 일정 데이터에 적용해 기후 집중 기사를 생성하는 시연을 공개했다.

Data2Story의 가장 두드러진 특징은 ‘인스펙터(Inspector)’ 패널이다. 기사에 등장하는 모든 문장·차트·인터랙티브 요소가 각각 증거 카드와 연결되며, 코드 출처나 외부 URL을 통해 근거를 직접 확인할 수 있다. 연구진에 따르면 전체 표시 항목의 93%가 출처 추적 가능 상태다. 이는 검증 가능성을 의미하는 것이지 내용의 정확성을 보장하는 것이 아님을 연구진은 강조한다. 비교 기준으로 인간이 작성한 기사에서 출처를 추적할 수 있는 항목은 평균 25%에 불과하다. 분석 코드를 공개하지 않는 저널리즘 관행이 그 원인이다. 7개 에이전트는 각각 탐정(Detective·웹 검색), 분석가(Analyst·코드 실행), 편집자(Editor·서사 결정), 디자이너(Designer·시각화 방식 선택), 프로그래머(Programmer·HTML 구성), 감사관(Auditor·레이아웃 검증), 인스펙터(Inspector·출처 연결)로 역할이 나뉜다. 기반 모델은 클로드 오퍼스 4.7(Claude Opus 4.7)이며 이미지·영상·오디오에는 OpenRouter의 gpt-5.4-image-2, seedance-2.0, lyria-3-pro-preview를 활용한다.

이미지 출처: 원문 (Data2Story turns a CSV file into a verified interactive news article using seven AI agents)

연구진은 18개 공개 데이터셋에 인간 작성 원본 기사를 대응시켜 53명의 평가자에게 두 버전을 비교 평가하게 했다. 인간 기사는 이코노미스트(The Economist)의 간결한 브리핑, 더 퍼딩(The Pudding)의 공들인 디자인 리포트, TidyTuesday 커뮤니티 데이터셋 기사를 포함했다. Data2Story는 시각 디자인, 서사 흐름, 데이터 투명성, 주장 검증 가능성, 인사이트 획득 5개 항목 모두에서 높은 점수를 받았다. 전체 74%의 평가자가 에이전트 기사를 선호했고, 25%는 인간 버전을 택했으며 2%는 비겼다. 투명성 항목의 점수 격차가 7점 척도 기준 +1.49로 가장 컸다. AI 뉴스 자동화와 저널리즘 논의에서 이 수치는 사실 확인 능력보다 출처 추적 가능성이 AI 생성 기사의 차별화 포인트로 부상하고 있음을 보여준다.

다만 에이전트 기사가 모든 영역에서 인간 기사를 앞선 것은 아니다. 인간 기사에 담긴 내용 중 Data2Story가 재현한 비율은 절반 수준이며, 반대로 에이전트 기사의 내용 중 인간 기사와 겹치는 부분도 35%에 그쳤다. 에이전트는 독자적인 각도를 많이 추가하지만 인간 기자의 편집적 핵심을 온전히 포착하지는 못한다는 의미다. 이코노미스트의 짧은 브리핑에서 재현율이 73%로 가장 높았는데, 이는 그 기사들이 표준 통계에 밀접히 붙어 있어 에이전트도 같은 수치를 자연스럽게 계산하기 때문으로 분석된다. 더 퍼딩의 수제 디자인 리포트와의 비교에서는 통계적으로 동점 수준에 그쳐, 정성적 창의 디자인 앞에서는 에이전트가 한계를 보였다.

연구진이 인간이 여전히 앞선다고 명시한 세 가지 영역은 이 한계를 구체화한다. 첫째는 편집 관점이다. 수리 카페 관련 기사에서 인간 기자는 제조사들이 의도적으로 수리 접근을 차단한다는 이면을 취재로 드러냈다. 데이터는 무엇이 고장 났는지를 보여주지만 왜 그런지는 보여주지 않는다. 둘째는 창의 디자인이다. 스탠드업 코미디 분석 기사에서 인간 기자는 전체 코미디 대본을 UI로 바꿔 대사 옆에 웃음 길이를 원 크기로 나타냈다. 에이전트는 같은 내용에 유튜브 썸네일을 넣었다. 셋째는 밀도 높은 단일 그래픽이다. 우주 경쟁 시각화에서 인간 기자는 정부·민간 공급사, 성공률, 주석을 하나의 차트로 통합했지만 에이전트는 데이터를 여러 차트로 분산시켜 핵심 메시지가 희석됐다. AI 할루시네이션과 출처 귀인 문제를 보면 Data2Story가 코드로 수치를 계산하고 인스펙터로 출처를 연결하는 방식은 이 문제를 구조적으로 줄이려는 접근이지만 완전한 해결책은 아니다.

한국 뉴스 시장에서 Data2Story 같은 데이터 저널리즘 자동화 도구가 가진 잠재력은 두 방향에서 살펴볼 수 있다. 긍정적 측면에서는 인력이 부족한 지역 매체나 전문 취재 인력이 없는 소규모 뉴스룸이 공공 데이터를 의미 있는 기사로 전환하는 데 활용할 수 있다. 선거 통계, 경제 지표, 환경 측정값 같은 데이터는 기사화되지 못하고 방치되는 경우가 많은데, Data2Story는 이 격차를 메울 도구가 될 수 있다. 우려 측면에서는 검증이 기술적 출처 추적에 집중돼 있고 인간 취재로만 확인할 수 있는 맥락·배경·이면은 여전히 에이전트의 역할 밖에 있다는 점이다. 인스펙터가 코드 출처를 연결한다고 해서 데이터 자체의 신뢰성이 보장되지는 않는다.

연구진은 Data2Story를 인간 대체재가 아닌 뉴스룸 협업 도구로 정의한다. 인간은 관점·취재·판단을 담당하고, 에이전트는 계산·시각화·기계 검증 가능한 출처 처리를 맡는다는 분업이다. 특히 뉴스룸이 인력 부족으로 다루지 못하는 틈새 데이터셋을 읽기 쉬운 기사로 전환하는 용도로 가장 유용할 것으로 제시된다. 현재 시스템은 완전 자동 실행 방식이며, 인간 피드백이 중간에 개입하는 버전은 향후 연구 과제로 남아 있다. 사이트는 data2story.github.io에서 라이브로 접근 가능하며 코드도 공개됐다.

데이터 저널리즘의 가장 큰 병목이 시간과 전문 인력이라는 점에서, Data2Story가 제시하는 7개 에이전트 분업 구조는 그 자체로 유효한 실험이다. 93%의 출처 추적 가능성은 현재 뉴스 생산 방식에서 쉽게 달성하기 어려운 수치다. 다만 이 시스템이 실제 뉴스룸에 채택되기 위해서는 한국어를 포함한 다국어 지원, 개인정보나 저작권 데이터가 포함된 복잡한 데이터셋 처리, 그리고 사람의 판단이 들어가는 중간 개입 기능 등이 추가 과제로 남는다. 자동화의 속도와 투명성이 저널리즘의 깊이와 공존할 수 있는지에 대한 답을 이 프로젝트가 점점 구체화하고 있다.