독일 중앙은행(Deutsche Bundesbank) 직원들은 증권이 담보로 적격한지 심사하기 위해 방대하고 반구조화된 이중 언어(독·영) 투자설명서를 일일이 검토해야 한다. 이 작업은 수작업에 크게 의존하는 자원 집약적 과제다. 기존에는 개체명 인식(NER) 같은 전통적 자연어 처리 기법을 활용했으나, OCR 오류, 언어 변형, 고정된 스팬 기반 제약 등의 한계로 복잡한 서류 환경에서 정확한 정보 추출이 어려웠다. arXiv에 공개된 연구(논문 ID: 2606.27316)는 이 문제를 대규모 언어 모델(LLM)로 해결하는 새로운 접근법을 제안한다.
연구팀이 제안한 시스템은 ‘추출, 정규화, 해석’의 세 단계 파이프라인으로 구성된다. 이 구조는 잡음이 섞인 텍스트와 독일어·영어가 혼재된 문서 환경에서도 더 높은 적응성을 발휘하도록 설계됐다. 방법론적으로 주목할 부분은 ‘LLM을 심사자로 활용하는(LLM-as-a-judge) 평가 방법론’으로, 위치 기반 지표보다 의미적 맥락에 더 초점을 맞춘 평가 방식을 채택했다. 이를 통해 문서 수준의 적격성 심사에서 최대 91%의 높은 정밀도를 달성했으며, 잘못된 승인을 최소화하는 보수적 판정 방식을 유지했다고 밝혔다.
이 연구는 금융 규제 기관의 문서 심사 업무에 LLM을 실제로 적용한 사례라는 점에서 의미가 있다. 중앙은행처럼 높은 정확도와 법적 책임이 요구되는 환경에서 AI의 실용적 도입 가능성을 검토했다는 점이 특징이다. 금융 서류는 분량이 많고 법률 용어와 수치가 혼재해 있어 자연어 처리의 난도가 높은데, LLM이 기존 NER 방식의 한계를 극복할 수 있는 대안으로 부상하고 있다. 중앙은행과 금융 감독 기관의 AI 자동화 수요가 커지는 가운데, 이번 연구는 실무 적용 가능성을 구체적으로 검증한 사례로 관련 분야의 주목을 받을 전망이다.














