AWS(아마존 웹 서비스)가 음성 대화 AI 모델 Amazon Nova 2 Sonic과 서버리스 에이전트 실행 플랫폼 Amazon Bedrock AgentCore를 결합해 의료 기관 예약 리마인더 음성 에이전트를 구축하는 기술 가이드를 공개했다. 미국 의료 분야의 예약 부도율(no-show rate)은 전문과에 따라 5~30%에 달하며, 이로 인한 수익 손실과 의료 서비스 지연이 지속적인 문제로 지목돼 왔다. 이번 솔루션은 환자 인증, 예약 확인·취소·변경, 방문 전 건강 정보 수집, 인간 상담원 전환(에스컬레이션) 4단계를 음성 AI 에이전트가 자동으로 처리하도록 설계됐다.
이 에이전트의 기술적 핵심은 음성 인식-추론-음성 합성을 별도 서비스로 분리하지 않고 하나의 모델로 처리하는 Amazon Nova 2 Sonic의 음성 대 음성(speech-to-speech) 방식이다. 기존 체이닝 방식에서는 각 단계 간 전환 시 지연이 발생하고, 환자의 말투나 톤 같은 음성적 맥락이 텍스트 변환 과정에서 손실된다. Nova 2 Sonic은 다국어 지원, 배경 소음 처리, 양방향 실시간 스트리밍, 정확한 도구 호출 기능을 갖추고 있다고 AWS는 밝혔다. Strands Agents SDK의 BidiAgent 클래스를 활용해 양방향 음성 스트리밍을 관리하며, Amazon Bedrock AgentCore가 컨테이너 기반 에이전트 로직의 인프라와 확장을 담당한다.
에이전트는 총 7가지 Python 기반 도구로 구성된다. 환자 인증(`authenticate_patient`), 예약 확인(`confirm_appointment`), 예약 취소(`cancel_appointment`), 가용 시간 조회(`find_available_slots`), 예약 변경(`book_appointment_slot`), 방문 전 건강 정보 기록(`record_health_update`), 인간 상담원 전환(`escalate_to_agent`)이 각각 Amazon DynamoDB에서 읽고 쓰는 구조다. 예약 이중 등록 방지를 위해 DynamoDB 조건부 쓰기를 적용했으며, 에스컬레이션 발생 시 6자리 참조 번호가 자동 생성돼 Amazon SNS를 통해 알림이 전송된다. React 프론트엔드는 Amazon Cognito 인증과 SigV4 서명 방식의 WebSocket 연결을 통해 에이전트와 통신한다.
AWS는 이번 가이드의 소스코드를 GitHub에 공개했으며, AWS CDK를 통해 필요한 인프라를 한 번에 배포할 수 있도록 지원한다. 다만 의료 현장에 실제 적용하려면 보호 건강 정보(PHI) 처리에 따른 HIPAA 컴플라이언스 검토와 AWS와의 사업 제휴 협약(BAA) 체결이 선행돼야 한다고 AWS는 강조했다. 이 아키텍처는 의료 분야에 국한되지 않으며, 도구 집합과 시스템 프롬프트를 교체하면 대규모 고객 통화가 필요한 소매나 호텔 산업 등 다른 분야에도 적용할 수 있다.














