앤트로픽, 에이전트 간 거래 실험…성능 차이가 협상 결과 좌우

앤트로픽이 AI 에이전트 간 거래를 실험하는 내부 마켓플레이스를 공개했다. 직원 69명에게 각각 100달러짜리 기프트카드를 지급하고, 에이전트들이 서로 상품을 사고파는 방식으로 진행됐다. 실험 기간 동안 총 186건의 거래가 성사됐으며, 거래 규모는 4000달러를 넘었다.

실험에서 드러난 핵심 발견은 사용하는 AI 모델의 성능 차이가 협상 결과에 직접 영향을 미쳤다는 점이다. 고성능 클로드 모델을 활용한 참가자의 에이전트가 더 유리한 조건으로 거래를 마쳤다. 반면 상대적으로 저성능 모델을 쓴 참가자들은 자신이 불리한 조건으로 거래했다는 사실 자체를 인지하지 못한 경우가 많았다.

앤트로픽은 이 현상을 ‘에이전트 품질 격차(agent quality gap)’라고 명명하고 최초로 문서화했다. AI 에이전트가 경제 행위자로 기능하는 환경에서 사용 모델의 품질 차이가 단순한 성능 지표를 넘어 실질적 경제적 불평등으로 이어질 수 있다는 점을 처음 제도적으로 확인한 것이다. 이 문제는 에이전트가 금융, 계약, 조달 등 고부가가치 업무를 대리할수록 더욱 심각해질 수 있다.

에이전트 경제(agentic economy)는 AI가 사람을 대신해 협상하고 구매하고 계약을 맺는 방향으로 빠르게 진화하고 있다. 이미 여러 기업이 AI 에이전트를 공급망 관리, 광고 입찰, 가격 협상 등 실무에 투입하기 시작했다. 앤트로픽의 실험은 이 흐름이 가속화될 때 불공정한 결과가 구조화될 위험을 미리 경고하는 의미를 지닌다.

이번 실험의 시사점은 단순히 AI 도구 선택의 문제가 아니다. 에이전트 간 거래가 일상화되면 모델 품질에 따른 협상 격차는 기업과 개인의 경제적 기회에 영향을 미치는 구조적 불평등 요인이 될 수 있다. 규제 당국과 기업 모두 에이전트 거래의 공정성과 투명성 기준을 마련하기 위한 논의를 서둘러야 할 것이다.