앤트로픽 클로드 코드, AI 에이전트 팀 조율하는 동적 실행 하네스 공개

앤트로픽(Anthropic)이 클로드 코드(Claude Code)의 Dynamic Workflows 기능이 내부적으로 어떻게 작동하는지 상세 내용을 공개했다. 핵심은 클로드가 자바스크립트 실행 하네스(harness)를 스스로 생성해 복수의 AI 에이전트에게 역할을 배분하고, 결과를 검증하며, 워크플로 전체 기간을 결정한다는 점이다. 이 기능은 대규모 소프트웨어 엔지니어링 프로젝트처럼 단일 컨텍스트 창으로 처리하기 어려운 장기 작업을 대상으로 설계됐다.

앤트로픽이 공개한 설명에 따르면 Dynamic Workflows는 특정 역할을 맡은 독립 에이전트 여러 개를 동시에 운용하는 방식으로 구성된다. 작업을 병렬 하위 작업으로 분해한 뒤 결과를 합치는 ‘팬아웃-앤-신서사이즈(fan-out-and-synthesize)’, 검토 에이전트가 다른 에이전트의 결과물에 반론을 제기하는 ‘적대적 검증(adversarial verification)’, 여러 에이전트가 동일 문제를 서로 다른 방식으로 해결한 뒤 성능을 비교하는 토너먼트 방식 등이 포함된다. 또한 작업 복잡도나 요구 사항에 따라 각기 다른 에이전트에 작업을 분배하는 분류기 시스템도 지원한다. 모델 라우팅 기능도 주목할 만하다. 단순 작업에는 저비용 모델을, 깊은 추론이 필요한 단계에는 고성능 모델을 각각 배치해 전체 실행 비용을 낮출 수 있다.

turned-on grey laptop computer — 사진: Arnold Francisca / Unsplash

이 접근 방식은 장기 실행 AI 작업에서 반복적으로 나타나는 문제들을 완화하려는 시도다. 앤트로픽은 작업을 완전히 완료하기 전에 멈추는 ‘에이전트 나태(agentic laziness)’, 모델이 평가 과정에서 자신의 결론을 과도하게 선호하는 ‘자기 편향(self-preferential bias)’, 긴 상호작용 중 목표가 흐려지는 ‘목표 표류(goal drift)’ 등을 구체적인 해결 대상으로 제시했다. 단일 에이전트가 하나의 긴 대화 흐름을 이어가는 방식 대신 독립적인 에이전트들이 서로를 견제하고 검증함으로써 이 문제들을 줄이겠다는 논리다.

개발자 커뮤니티의 반응은 엇갈린다. 일부는 더 자율적인 AI 시스템으로 나아가는 의미 있는 진전이라고 평가하는 반면, 비용 대비 실효성에 의문을 제기하는 시각도 있다. 한 개발자는 온라인 토론에서 “언젠가는 유용해지겠지만 지금은 토큰을 태우는 멋진 방법일 뿐”이라고 꼬집었다. Dynamic Workflows는 AI 성능 개선의 방향을 개별 모델 능력 향상에서 에이전트 조율 구조로 전환하는 산업 전반의 흐름과 맞닿아 있으며, 앤트로픽이 이 분야에서 구체적인 구현 세부 사항을 공개한 것은 경쟁사들의 유사 시도와 비교되는 주요 지점이 될 전망이다.