마이크로소프트가 연례 개발자 행사 Microsoft Build 2026에서 Azure Kubernetes Service(AKS)에 대한 광범위한 업데이트를 발표했다. 핵심 발표는 AKS 베어메탈(Bare Metal) 퍼블릭 프리뷰, Arc 지원 클러스터를 포함한 Azure Kubernetes Fleet Manager 정식 출시, AI 분산 워크로드 관리 서비스 Anyscale on Azure 프리뷰, 그리고 AI 모델 배포 프레임워크 AI Runway 등이다. 마이크로소프트는 AI 학습·추론 워크로드의 운영 기반을 Kubernetes로 통일하겠다는 방향을 이번 발표를 통해 명확히 했다.
가장 주목받는 기능은 베어메탈 AKS다. 가상화 계층을 제거해 NVLink, RDMA 등 고성능 네트워킹 기술에 직접 접근할 수 있도록 하는 것이 핵심으로, 대규모 언어 모델(LLM) 학습이나 지연에 민감한 추론 작업에서 성능 이점이 클 것으로 예상된다. 마이크로소프트는 가상화가 일부 AI 워크로드에 측정 가능한 성능 저하를 유발한다는 점을 인정하면서, 베어메탈 AKS가 하드웨어 성능과 Kubernetes 운영 일관성을 동시에 제공하는 것을 목표로 한다고 설명했다. Anyscale on Azure는 분산 AI 워크로드를 위한 관리형 Ray 서비스로, Azure 구독 및 거버넌스 체계에 직접 통합된다. AI Runway는 모델 선택부터 GPU 요건 검증, 배포 비용 추산, 프로덕션 엔드포인트 구동까지를 Kubernetes 네이티브 추상화로 처리하며, 내부적으로는 vLLM 런타임과 KEDA 오토스케일링을 활용한다.

멀티클러스터 운영 측면에서는 Fleet Manager가 클라우드와 온프레미스 환경을 아우르는 정책 집행, 워크로드 배치, 단계적 롤아웃, RBAC 거버넌스를 중앙에서 처리할 수 있도록 지원 범위를 넓혔다. 클러스터를 개별 단위가 아닌 통합 플랫폼으로 관리하는 흐름이 업계 전반에서 강화되는 가운데, 마이크로소프트는 오픈소스 생태계(Kubernetes, Ray, Gateway API, vLLM 등)를 기반으로 관리형 서비스를 쌓아 올리는 전략을 취하고 있다. AWS EKS, 구글 GKE와의 경쟁이 심화하는 상황에서 이번 발표는 마이크로소프트가 기업용 AI 인프라의 운영 기반으로 Kubernetes를 전면에 내세우는 행보로 해석된다.














