아마존 웹서비스(AWS)가 AI 에이전트를 프로덕션 환경에서 운영하는 데 필요한 인프라를 단일 관리형 추상화로 제공하는 ‘Amazon Bedrock AgentCore 하네스’를 정식 출시(GA)했다. 4월 프리뷰 이후 정식 버전으로 전환된 이 서비스는 `CreateHarness`와 `InvokeHarness` 두 가지 API 호출만으로 에이전트를 정의하고 실행할 수 있도록 설계됐다. 에이전트를 실험 단계에서 프로덕션까지 올리는 데 수일이 걸리던 작업을 분 단위로 단축할 수 있다고 AWS는 밝혔다.
하네스는 런타임, 메모리, 게이트웨이, 브라우저, ID 관리, 관찰 가능성(Observability) 등 AgentCore 핵심 기본 요소들을 자동으로 연결해 제공한다. 사용자가 별도로 오케스트레이션 코드를 작성하거나 컨테이너를 빌드하지 않아도 격리된 환경에서 에이전트가 파일 읽기·쓰기, 명령 실행, 웹 탐색, 도구 호출을 수행한다. 모델 전환 기능도 핵심으로, 세션 중간에 Claude Opus, GPT-5.5, Gemini 등 서로 다른 제공사의 모델로 전환해도 대화 맥락이 유지된다. OpenAI GPT-5.5와 GPT-5.4도 Bedrock을 통해 지원된다고 AWS는 밝혔다.
메모리 관리 측면에서는 `CreateHarness` 시 별도 구성 없이 관리형 메모리가 자동으로 프로비저닝된다. 의미론적(SEMANTIC) 처리와 요약(SUMMARIZATION) 전략을 기본 적용하고, 30일 이벤트 만료 및 AWS 소유 암호화가 설정된다. 에이전트 평가와 최적화 기능도 GA에서 새로 추가됐다. LLM-as-a-judge 방식의 빌트인 평가자가 유용성·충실도·안전성을 자동 채점하고, 이 점수를 바탕으로 프롬프트와 도구 설명에 대한 개선 권고안을 생성한다. 권고안은 실제 트래픽을 두 변형으로 나눠 A/B 테스트를 거친 후 통계적 유의성이 확인되면 적용할 수 있다.
하네스 사용에 따른 별도 요금은 없으며, 런타임 컴퓨팅은 vCPU 시간당 0.0895달러, GB 시간당 0.00945달러의 소비량 기반 가격 체계가 적용된다. 현재 AgentCore를 정식 서비스 중인 모든 AWS 리전에서 이용할 수 있다. 에이전트 구성이 코드 수준의 제어가 필요한 수준으로 성장하면 CLI 명령 한 번으로 Strands 기반 코드로 내보낼 수 있으며, Claude Agent SDK 지원도 곧 추가될 예정이라고 AWS는 밝혔다.














