AWS, AI 기반 지능형 문서 처리 파이프라인 아키텍처 공개

아마존웹서비스(AWS)가 생성형 AI 서비스를 활용한 지능형 문서 처리(IDP, Intelligent Document Processing) 파이프라인 아키텍처를 공개했다. 이 솔루션은 보험 청구서, 청구서, 법률 계약서, 의료 기록 등 비정형 문서에서 의미와 맥락까지 추출하는 것을 목표로 하며, 기존 광학 문자 인식(OCR) 방식이 다루지 못했던 차트·그래프·다이어그램 등 시각 요소의 구조화된 해석까지 포함한다. AWS는 이 아키텍처를 PDF 5만 건 동시 처리 환경에서 검증했으며, 서버리스 구조 덕분에 성능 저하 없이 처리가 가능했다고 밝혔다.

파이프라인은 네 개 레이어로 구성된다. 입력 처리 레이어는 아마존 S3 버킷에 파일이 도착하면 AWS 스텝 펑션(Step Functions)이 워크플로를 자동으로 기동한다. 추출·저장 레이어의 핵심은 아마존 베드록 데이터 자동화(BDA, Bedrock Data Automation)로, 단일 API 호출로 문서 분류, 텍스트·표·양식 추출, 시각 요소 분석, 페이지·문서 요약을 한 번에 처리한다. BDA는 건당 최대 3,000페이지, 500MB 규모 문서를 지원하며, 사전 구성한 블루프린트(blueprint)를 통해 청구서·계약서 등 문서 유형별 맞춤 추출 규칙을 적용할 수 있다. 인텔리전스 레이어는 아마존 베드록 지식 기반과 아마존 오픈서치 서버리스(Amazon OpenSearch Serverless)를 결합해 처리된 문서를 벡터 임베딩으로 색인화하고, 검색 증강 생성(RAG) 방식으로 복수 문서에 걸친 복합 질의를 지원한다. 에이전틱 조정 레이어에서는 스트랜즈 에이전트(Strands Agents)가 시장 분석, 투자 자문, 외부 API 연동 등 역할별 특화 에이전트에 작업을 라우팅하고 교차 검증을 수행한다.

실제 활용 사례로 상업용 부동산 투자 분석을 예시로 제시했다. 월 200건 이상의 매물 평가 보고서를 처리해야 하는 투자 회사 환경에서, 이 파이프라인을 적용한 결과 건당 초기 심사 소요 시간이 기존 3~4시간에서 15~20분으로 줄었다. 자동 추출로 수작업 전사 오류가 제거되고, 문서 간 교차 검증으로 데이터 불일치도 자동으로 식별할 수 있었다. 투자 담당자는 “수익률(IRR) 12% 이상이고 부채감당비율 1.25 초과인 매물을 보여 달라”는 식의 자연어 질의로 필요한 정보를 즉시 조회할 수 있다.

전체 인프라는 AWS CDK(클라우드 개발 키트)로 코드형 인프라(IaC) 방식으로 구성되며, 깃허브 퍼블릭 리포지터리를 통해 샘플 코드와 배포 스크립트를 제공한다. BDA는 현재 미국 동부·서부, 유럽, 아시아태평양 등 8개 리전에서 운용 중이며, AWS는 문서 복잡도에 따른 지능형 라우팅과 S3 스토리지 수명 주기 정책을 통해 비용을 최적화할 것을 권장했다.