AUDITFLOW, 그래프 기반 다중 에이전트로 금융 감사 정확도 82% 달성

재무제표의 정확성을 AI가 검증하는 작업은 텍스트 이해만으로는 충분하지 않다는 문제의식에서 출발한 연구가 2026년 6월 2일 arXiv에 공개됐다. 논문 ‘AUDITFLOW: Executable Symbolic Environments for Structured Financial Reporting Verification'(arXiv:2606.03031)은 언어 모델 에이전트가 구조화된 재무 감사를 수행하려면 보고된 사실을 분류 체계 개념에 연결하고, 계산·차원 관계를 탐색하며, 감사 규칙을 적용하기 전에 기댓값을 직접 재계산해야 한다는 점에 주목했다.

연구팀은 이를 위해 AuditFlow라는 그래프 기반 다중 에이전트 프레임워크를 제안했다. 이 시스템은 정적(static) US-GAAP 분류 체계 그래프와 동적(dynamic) XBRL(확장 가능 사업 보고 언어) 재무제표 그래프를 결합해 실행 가능한 상징적 환경(symbolic environment)을 구축한다. 내부에는 규제 관점과 증거 관점에서 각각 사례를 검토하는 두 명의 주니어 감사 에이전트, 이들의 의견 충돌을 조정하고 추가 조사를 요청할 수 있는 시니어 감사 에이전트가 있다. 최종 감사 판정은 증거 집계 방식을 통해 도출되며, 결과와 함께 기댓값, 근거 추적, 신뢰도 점수가 제공된다. FinAuditing 파생 FinMR 샘플에서 GPT-5.5 기반 시스템이 82.09%의 공동 감사 정확도를 달성해 기존 최선 기준선 대비 14.93%p 앞섰다. 결정론적 검증 모듈을 제거하면 정확도가 17.91%로 급락해, 기호 환경이 수치 검증 단계를 실제로 수행하고 있음을 확인했다.

AI가 금융 보고서 검증에 활용되기 시작한 것은 새로운 현상이 아니지만, 기존 연구는 대체로 언어 모델이 텍스트를 이해하고 요약하는 수준에 집중했다. AuditFlow는 분류 체계 탐색, 수치 재계산, 규칙 적용 등 실제 감사 절차와 대응하는 도구를 명시적으로 정의하고, 이를 에이전트에게 제공함으로써 모델이 ‘직접 계산’할 수 있는 환경을 만들었다. 이 접근법은 법령·규제처럼 구조화된 정보를 다루는 다른 도메인에도 적용 가능한 설계 패턴을 제시한다는 점에서 관심을 받고 있다.

저자 팀에는 Yan Wang, Xuguang Ai, Jaisal Patel 등 다수가 참여했으며, 논문은 arXiv(2606.03031)에서 공개돼 있다. 금융 AI 분야에서 규제 준수 자동화 수요가 높아지는 가운데, 결정론적 검증과 에이전트 기반 추론을 결합하는 방향의 연구가 향후 더 활발해질 전망이다.