클라우드 인프라는 오랫동안 사람의 행동을 전제로 설계돼 왔다. 사람은 검색하고 클릭하고 스크롤하고 스트리밍하며 비교적 일정하고 예측 가능한 패턴으로 자원을 사용한다. 그러나 AI 에이전트의 행동 방식은 전혀 다르다. 하나의 요청에서 여러 하위 에이전트를 한꺼번에 띄워 수백 개의 데이터베이스를 조회하고 문서를 뒤지며 API를 수 초 안에 호출했다가, 등장할 때만큼이나 빠르게 사라진다. 이런 불규칙한 부하는 기존 설계가 가정하지 않았던 패턴이다.
이 같은 변화를 배경으로 아마존은 클라우드 인프라의 핵심 구성 요소를 다시 설계하고 있다. 업계 전반에서 사람 중심으로 만들어진 인터넷이 에이전트가 점점 늘어나는 환경에서는 제대로 작동하지 않는다는 인식이 커지고 있기 때문이다. 한 보안 인프라 기업의 집계에 따르면 최근 6개월간 전체 HTTP 트래픽의 31%가 봇에서 나왔고, AI 크롤러와 검색 엔진, 어시스턴트가 그 봇 요청의 약 4분의 1을 차지했다. 비인간 트래픽이 2027년 상반기 중 인간 트래픽을 추월할 것이라는 전망까지 나온다.

아마존이 내놓은 새 서버리스 검색 서비스의 핵심 기술 변화는 연산과 저장을 분리한 점이다. 기존 버전에서는 저장과 연산이 묶여 있어 사용하지 않을 때도 최소 한 대의 인스턴스를 늘 켜둬야 했다. 빈 연산 자원을 예약해두고 비용을 내는 구조였던 셈이다. 새 세대에서는 에이전트 트래픽이 폭증하면 수 초 만에 연산을 끌어올리고, 유휴 상태가 되면 0까지 낮춰 에이전트가 쉬는 동안에는 비용이 들지 않는다. 책임자는 이를 두고 쓰지 않을 때도 내는 고정 주차료에서 사용한 만큼만 내는 미터형 주차료로 바뀐 것이라고 비유했다.
이 서비스는 출시 시점부터 Vercel, Kiro 같은 AI 개발 플랫폼과 기본 연동돼, 개발자가 인프라를 직접 관리하지 않고도 에이전트용 검색·벡터 백엔드를 곧바로 운영 환경에 배포할 수 있다. 책임자는 에이전트가 실험 단계를 지나 운영 단계로 넘어가고 있으며, 이들이 만들어내는 트래픽 패턴은 과거 인프라가 설계 단계에서 고려하지 않았던 것이라고 설명했다. 예고 없이 치솟고 통보 없이 멈추는 부하를 비용 부담 없이 따라잡는 검색이 필요해졌다는 것이다.
한국 IT·클라우드 업계에도 시사점이 크다. 국내 기업들도 생성형 AI를 넘어 자율 에이전트를 업무 시스템에 붙이기 시작하면서 기존 사람 기준의 용량 산정과 과금 모델이 흔들릴 가능성이 높다. 유휴 비용을 0으로 낮추는 연산·저장 분리형 인프라는 비용 예측을 어렵게 만드는 동시에, 에이전트 도입의 진입 장벽을 낮춰 더 큰 규모의 자동화를 앞당기는 양날의 변화로 작용할 것이다. 클라우드를 빌려 쓰는 국내 스타트업과 대기업 모두 과금 구조와 트래픽 모니터링 전략을 에이전트 시대에 맞게 재점검할 시점이다.


