아마존 웹 서비스(AWS)가 Amazon Bedrock Data Automation(BDA)에 블루프린트 지침 자동 최적화 기능을 추가했다. 청구서·계약서·세금 서식 등 비정형 문서에서 구조화된 데이터를 추출하는 작업의 정확도를 높이기 위한 것으로, 사용자가 예시 문서 3개에서 10개와 각 문서의 정답 값(ground truth)을 제공하면 BDA가 추출 지침을 자동으로 다듬어준다. 별도 모델 파인튜닝 없이 수 분 안에 최적화가 완료된다.
기존에는 문서마다 다른 레이아웃이나 필드 표기 방식을 처리하기 위해 추출 지침을 수작업으로 반복 수정해야 했고, 수백 개 공급업체 문서를 다루는 조직에서는 이 과정에 수 주가 소요되는 경우도 있었다. 블루프린트 지침 최적화는 BDA가 추출 결과와 정답 데이터 간 차이를 분석해 각 필드의 자연어 지침을 자동으로 구체화하는 방식으로 작동한다. AWS가 공개한 구매 주문서 예시에서는 최적화 후 특정 파일의 정확 일치율이 92.4%에서 100%로 올랐으며, 전체 집계 기준 정확 일치율은 90%에서 92%로 개선됐다.
최적화 결과를 판단하기 위해 세 가지 지표가 제공된다. 정확 일치율(Exact Match Rate)은 추출값이 정답과 글자 단위로 일치하는 필드의 비율을 나타내며, 전체 F1 점수는 정밀도와 재현율을 결합한 지표로 가변 길이 필드 평가에 유용하다. 신뢰도 점수(Confidence Score)는 추출 결과의 확실성을 반영해 사람이 검토해야 할 항목의 양을 조절하는 데 쓸 수 있다. 최적화된 블루프린트는 Amazon Bedrock Knowledge Bases의 RAG 워크플로나 Amazon Bedrock Agents의 자율 문서 처리 파이프라인과 연동해 정확도의 개선 효과를 하위 단계까지 전파할 수 있다.
이 기능은 Amazon Bedrock Data Automation이 지원되는 AWS 리전에서 이용할 수 있으며, 최적화 과정에서 발생하는 비용은 예시 문서 페이지 수에 따른 표준 BDA 추론 요금이 적용된다. 고용량 문서 처리 파이프라인에서는 정확도가 몇 퍼센트포인트 오르는 것만으로도 수동 검토 건수와 처리 지연이 의미 있게 줄어들 수 있다.














