앤트로픽이 새 모델 ‘클로드 오퍼스 4.8’을 공개하며 모델의 ‘정직성(honesty)’을 핵심으로 내세웠다. 초기 테스터들이 이 모델은 자신의 작업에 대한 불확실성을 더 잘 드러내고, 근거 없는 주장을 덜 한다고 평가했다는 것이다. 회사 자체 평가에서 오퍼스 4.8은 자신이 작성한 코드의 결함을 그냥 넘어갈 확률이 직전 모델보다 약 4분의 1 수준으로 낮았다.
정직성 개선과 함께, 사용자가 클로드가 작업에 들이는 ‘노력의 양’을 직접 조절할 수 있는 기능도 도입됐다. 높은 노력 응답은 더 많은 토큰을 쓰는 대신 품질을 높이고, 토큰 사용 한도를 빠르게 소진하고 싶지 않은 사용자는 낮은 노력 응답을 선택할 수 있다. 비용과 품질 사이의 균형을 사용자가 직접 정하도록 한 것이다.

앤트로픽은 ‘다이내믹 워크플로(dynamic workflows)’라는 기능도 연구 프리뷰로 함께 선보였다. 클로드가 더 큰 과제를 맡을 수 있게 하는 기능으로, 작업을 스스로 계획한 뒤 한 세션 안에서 수백 개의 병렬 하위 에이전트를 실행한다. 그리고 결과를 사용자에게 보고하기 전에 스스로 검증하는 단계를 거친다.
이런 방향은 AI 모델 경쟁의 초점이 단순한 성능 지표를 넘어, 모델이 자신의 한계를 얼마나 정직하게 드러내고 복잡한 작업을 안정적으로 수행하느냐로 옮겨가고 있음을 보여준다. 환각과 과장된 자신감이 실무 도입의 걸림돌로 지적돼 온 만큼, 불확실성을 스스로 밝히는 능력은 신뢰성의 핵심 요소로 부상하고 있다.
특히 수백 개의 하위 에이전트를 병렬로 돌리고 결과를 자체 검증하는 구조는, AI가 단발성 답변을 넘어 긴 호흡의 업무를 대신 수행하는 에이전트 시대로 가고 있음을 보여준다. 코드 작성과 검증을 자동화하려는 국내 개발 조직으로서도, 모델의 정직성과 자기검증 능력은 도입 가치를 가르는 기준이 될 전망이다.


