• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

앤트로픽 ‘클로드 오퍼스 4.8’ 공개… 핵심은 ‘정직성’

STORIUM 편집부 작성: STORIUM 편집부
2026년 05월 30일 17시 43분
Home AI 모델·연구
Share on FacebookShare on Twitter

앤트로픽이 새 모델 ‘클로드 오퍼스 4.8’을 공개하며 모델의 ‘정직성(honesty)’을 핵심으로 내세웠다. 초기 테스터들이 이 모델은 자신의 작업에 대한 불확실성을 더 잘 드러내고, 근거 없는 주장을 덜 한다고 평가했다는 것이다. 회사 자체 평가에서 오퍼스 4.8은 자신이 작성한 코드의 결함을 그냥 넘어갈 확률이 직전 모델보다 약 4분의 1 수준으로 낮았다.

정직성 개선과 함께, 사용자가 클로드가 작업에 들이는 ‘노력의 양’을 직접 조절할 수 있는 기능도 도입됐다. 높은 노력 응답은 더 많은 토큰을 쓰는 대신 품질을 높이고, 토큰 사용 한도를 빠르게 소진하고 싶지 않은 사용자는 낮은 노력 응답을 선택할 수 있다. 비용과 품질 사이의 균형을 사용자가 직접 정하도록 한 것이다.

Tractatus-Politico-Philosophicus AI.v1
출처: Wolne Wybory / Wikimedia Commons / CC BY 4.0

앤트로픽은 ‘다이내믹 워크플로(dynamic workflows)’라는 기능도 연구 프리뷰로 함께 선보였다. 클로드가 더 큰 과제를 맡을 수 있게 하는 기능으로, 작업을 스스로 계획한 뒤 한 세션 안에서 수백 개의 병렬 하위 에이전트를 실행한다. 그리고 결과를 사용자에게 보고하기 전에 스스로 검증하는 단계를 거친다.

이런 방향은 AI 모델 경쟁의 초점이 단순한 성능 지표를 넘어, 모델이 자신의 한계를 얼마나 정직하게 드러내고 복잡한 작업을 안정적으로 수행하느냐로 옮겨가고 있음을 보여준다. 환각과 과장된 자신감이 실무 도입의 걸림돌로 지적돼 온 만큼, 불확실성을 스스로 밝히는 능력은 신뢰성의 핵심 요소로 부상하고 있다.

특히 수백 개의 하위 에이전트를 병렬로 돌리고 결과를 자체 검증하는 구조는, AI가 단발성 답변을 넘어 긴 호흡의 업무를 대신 수행하는 에이전트 시대로 가고 있음을 보여준다. 코드 작성과 검증을 자동화하려는 국내 개발 조직으로서도, 모델의 정직성과 자기검증 능력은 도입 가치를 가르는 기준이 될 전망이다.

Tags: AI 정직성Opus 4.8앤트로픽에이전트클로드
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
일리노이 AI 안전검증법 통과, 앤트로픽·오픈AI도 지지

일리노이 AI 안전검증법 통과, 앤트로픽·오픈AI도 지지

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI 검색 AI과학 AI규제 AI안전 AI 에이전트 AI에이전트 AI 인프라 AI 코딩 Anthropic AWS Claude Co-Scientist Gemini IPO LLM OpenAI SynthID 검색 구글 구글 딥마인드 기업공개 노동시장 데이터센터 딥시크 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 생산성 스노우플레이크 스타트업 투자 스페이스X 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 오픈소스 로봇 중국 챗GPT 클라우드 클로드 허깅페이스

최근 뉴스

유럽의회 스트라스부르 루이즈 바이스 건물 반원형 의회장 내부

EU AI법 옴니버스 합의: 기한 최대 16개월가량 연장, 딥페이크 신규 금지

2026년 05월 30일 21시 11분
그로크 LPU v1 칩 다이 사진

그로크, 기존 투자자 대상 6.5억 달러 추가 조달 추진

2026년 05월 31일 00시 20분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.