오픈AI(OpenAI) 전방배치 엔지니어 팀과 Thrive Holdings 산하 세금 신고 플랫폼 Crete가 공동 개발한 자가 개선형 세금 에이전트 ‘Tax AI’가 이번 세금 신고 시즌에 30곳 이상의 회계법인에서 7000건의 세금 신고를 처리했다. 해당 시스템은 Codex를 중심으로 한 자율 개선 루프를 통해 출시 6주 만에 전체 신고서의 75% 이상 정확도 달성 비율을 25%에서 86%로 높이는 데 성공했다.
Tax AI의 핵심 설계 원리는 실무자 피드백, 생산 추적 데이터, Codex 기반 반복 루프라는 세 가지 축으로 구성된다. 회계사들이 세금 신고서를 검토하고 수정할 때 그 교정 내역이 구조화된 데이터로 축적되고, 시스템은 반복되는 오류 패턴을 탐지해 Codex가 처리할 수 있는 명확한 엔지니어링 작업으로 변환한다. Codex는 소스 파일과 추출 스키마, 코드 경로를 직접 분석해 근본 원인을 진단하고 수정안을 제안하며 검증 결과를 포함한 풀 리퀘스트를 생성한다. 이 구조 덕분에 실무자들이 서비스를 제공하는 과정 자체가 시스템을 지속 개선하는 피드백 원천이 된다.

성과 수치도 주목할 만하다. Tax AI는 세금 신고 준비 시간을 약 3분의 1 단축하고, 신고서를 최대 97% 정확도로 초안 작성하며 처리량을 약 50% 높였다. 초기에는 W-2, 1099 등 단순 신고서를 주로 처리했으나 시즌이 진행되면서 K-1 등 복잡한 신고서로 범위를 넓혔다. 복잡한 임대 부동산 일정표 등 새로운 기능 지원도 반복 루프를 통해 점진적으로 추가됐으며, 유사 기능을 지원하는 데 이전보다 더 적은 엔지니어링 감독이 필요해졌다.
Thrive Holdings의 구조는 이 방식을 가능하게 하는 핵심 조건이다. 투자 회사이자 운영 회사로서 엔지니어링 팀이 Crete 같은 사업체 내부에서 실무자, 생산 데이터와 직접 접촉하는 환경이 갖춰져 있어, 기술·제품·서비스가 한 지붕 아래 놓인다. 실제 사례로, 전년도에 세금 신고에 180시간을 쓴 한 선임 회계사는 올해 15시간으로 줄었고, 절감된 시간을 모든 고객에게 개별 전화 상담을 제공하고 신규 고객을 확보하는 데 활용했다. 오픈AI와 Thrive는 이 자가 개선 에이전트 설계를 세금 신고 외에도 장부 관리, 감사, IT 헬프데스크 자동화 등 다른 업무 영역으로 확장하고 있다.


