AWS가 Amazon Bedrock AgentCore를 이용해 완전한 테넌트 격리와 서비스 등급 차별화를 갖춘 멀티테넌트 AI 에이전트 시스템을 구축하는 방법을 공식 블로그를 통해 공개했다. 다수의 고객을 동시에 서비스하는 AI 애플리케이션은 테넌트 간 데이터 누출 방지, 서비스 품질 차등화, 테넌트별 세분화된 비용 추적 등 기존 단일 테넌트 구조와는 다른 아키텍처 과제를 안고 있다. 이번 가이드는 의료 AI 에이전트를 예시로 삼아 소규모 클리닉과 대형 병원을 단일 인프라에서 서비스하는 구체적 구현 방식을 다룬다.
핵심 아키텍처는 티어(Tier) → 테넌트(Tenant) → 사용자(User)로 이어지는 3단 계층 구조다. 기본(Basic) 티어는 소규모 의원을 대상으로 문서 검색에 최적화된 경량 모델을 활용해 비용 효율성을 높인다. 프리미엄(Premium) 티어는 복잡한 임상 분석이 필요한 대형 병원에 대형 추론 모델을 제공하며 웹 검색 도구도 독점적으로 사용할 수 있다. 두 티어는 동일한 기반 인프라를 공유하는 풀(Pool) 모델로 운영되며, 스코프 식별자·접근 정책·데이터 파티셔닝을 통해 테넌트 간 논리적 격리를 유지한다. 이 방식은 전용 인프라를 테넌트별로 분리하는 사일로 모델에 비해 자원 활용률과 운영 편의성이 높다.

세부 구성 요소로는 Amazon Cognito가 사용자 인증과 테넌트 메타데이터(티어, 클리닉 ID, 역할)를 JWT 클레임으로 관리하고, Amazon API Gateway는 티어 기반 요청 처리량 제한을 적용한다. AWS Lambda는 테넌트 컨텍스트를 추출해 AgentCore 에이전트를 호출하고, Amazon S3는 티어별로 분리된 버킷과 계층형 접두사 구조로 의료 문서를 저장한다. Amazon Bedrock 지식 기반(Knowledge Bases)은 메타데이터 필터링으로 각 테넌트의 문서 범위만 검색하게 한다. 비용 추적은 Amazon Bedrock 프로젝트의 비용 배분 태그로 티어 단위 집계가 가능하다. AWS는 이 패턴이 의료 외에도 SaaS 플랫폼, 다수 사업부를 서비스하는 엔터프라이즈 솔루션 등 다양한 멀티테넌트 AI 환경에 적용될 수 있다고 밝혔다.
국내 AI 서비스 시장에서도 B2B SaaS 모델이 확산되면서 단일 인프라에서 다수 고객사를 서비스해야 하는 수요가 커지고 있다. 특히 의료·금융·공공 분야는 데이터 격리 의무가 강해 멀티테넌트 설계가 어렵다는 인식이 있었지만, 이번 사례는 AWS 네이티브 서비스만으로도 규정 수준의 격리를 달성할 수 있음을 보여준다. 국내 클라우드 기반 AI 에이전트 개발팀에 참고할 만한 실용적 아키텍처 청사진이 될 것으로 보인다.














