미스트랄 OCR 4, 블라인드 테스트 72% 우위 — PDF·파워포인트 구조 인식 지원

미스트랄AI(Mistral AI)가 문서 광학 문자 인식(OCR) 모델의 새 버전인 OCR 4를 출시했다. OCR 4는 PDF, 워드 파일, 파워포인트 프레젠테이션 등 다양한 형식의 문서에서 텍스트를 추출하며, 단순 텍스트 추출에 그쳤던 이전 버전과 달리 각 요소가 페이지 내 어느 위치에 있는지, 어떤 역할을 하는지까지 함께 파악한다. 제목·표·수식·서명 등 요소를 구분하는 블록 분류 기능을 갖춰 문서를 의미 단위로 자동 분할하는 것이 가능해졌다.

미스트랄AI에 따르면 독립 평가자들이 600건 이상의 문서를 대상으로 진행한 블라인드 테스트에서 OCR 4의 결과물이 경쟁 모델보다 우수하다고 판단한 비율이 72%에 달했다. OCR 4는 170개 언어를 지원하며, 상대적으로 사용 빈도가 낮은 언어에서도 안정적인 인식 성능을 발휘한다고 회사 측은 밝혔다. 모델은 단어 또는 페이지 단위로 인식 신뢰도 점수를 함께 출력해 결과의 불확실성을 수치로 확인할 수 있다.

OCR 4는 API, 미스트랄 스튜디오(Mistral Studio), 마이크로소프트 파운드리(Microsoft Foundry)를 통해 이용할 수 있다. 가격은 1,000페이지당 4달러이며, 배치 처리 모드를 활용하면 2달러로 낮아진다. 문서를 검색 시스템에 연동하거나 AI 에이전트가 자동으로 처리할 수 있도록 구조화된 형태로 변환하는 용도에 적합하도록 설계됐다고 미스트랄AI는 설명했다.

문서 처리 자동화 수요는 엔터프라이즈 AI 도입과 함께 빠르게 늘고 있다. OCR 4의 블록 분류 기능은 계약서, 보고서, 연구 논문 등 구조가 복잡한 문서를 AI 파이프라인에 연결할 때 특히 유용하다. 미스트랄AI는 유럽 최대의 독립 AI 연구·개발사 중 하나로, 오픈소스 모델과 상업용 서비스를 병행 운영하며 글로벌 AI 도구 시장에서 입지를 넓히고 있다.