앤트로픽(Anthropic)이 28일(현지시간) 차세대 플래그십 언어 모델 ‘클로드 오퍼스(Claude Opus) 4.8’을 공식 발표하고 동일 일자부터 전면 제공에 나섰다. 코딩과 에이전틱(agentic, 자율형) 작업, 전문 업무 전반에서 전작 대비 성능이 향상된 이 모델은 복수의 벤치마크에서 오픈AI(OpenAI) GPT-5.5를 앞섰다고 앤트로픽은 밝혔다.
구체적으로 오퍼스 4.8은 웹 에이전트 평가 지표인 온라인-마인드투웹(Online-Mind2Web)에서 84%를 기록했으며, 법률 분야 에이전트 벤치마크에서는 업계 최초로 ‘전 항목 통과’ 기준 10%를 넘었다. 정직성 측면에서도 두드러진 개선이 확인됐다. 앤트로픽에 따르면 오퍼스 4.8은 자신이 작성한 코드의 결함을 지적 없이 넘기는 비율이 전작의 약 4분의 1 수준에 그쳐, 장기 자율 작업에서의 신뢰도가 높아졌다고 평가됐다. 가격은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러로 전작과 동일하며, 2.5배 속도를 지원하는 패스트 모드는 각각 10달러·50달러로 이전 대비 3분의 1 수준으로 낮아졌다.

같은 날 앤트로픽은 오퍼스 4.8보다 높은 역량을 갖춘 ‘미토스(Mythos)’ 계열 모델의 향후 개방 일정도 시사했다. 현재 미토스 프리뷰는 소수 기관에 사이버보안 목적으로만 제한 제공 중이다. 앤트로픽은 이 수준의 모델에는 더 강력한 사이버 안전장치가 선행돼야 한다며, 해당 장치를 마련하는 대로 “수주 내(coming weeks)” 전 고객으로 접근을 확대할 계획이라고 밝혔다. 같은 날 발표된 ‘프로젝트 글래스윙(Project Glasswing)’에는 AWS·애플·MS·구글·엔비디아·시스코·크라우드스트라이크·팔로알토네트웍스 등 주요 정보기술(IT)·보안 기업이 참여해 핵심 소프트웨어 보안을 공동으로 강화하는 틀을 형성했다.
오퍼스 4.8 공개와 미토스 개방 예고는 모델 역량과 안전 통제 수준을 동시에 높여야 한다는 이른바 ‘능력-안전 균형’ 논쟁의 연장선에 있다. 사이버보안에 활용될 만큼 강력한 모델일수록 악용 위험도 커지는 만큼, 업계에서는 최고 성능 모델을 언제 어떤 조건으로 전면 공개할 것인지를 두고 보안 전문가·정책 입안자들 사이에서 논의가 이어지고 있다. 앤트로픽은 미토스급 모델의 일반 공개에 앞서 더 강력한 사이버 안전장치 마련이 선행 조건임을 공식화하며, 단계적·신중한 공개 기조를 유지하겠다는 입장을 재확인했다.


