아마존 웹 서비스(AWS)가 아마존 퀵(Amazon Quick)과 뉴 렐릭(New Relic), 아사나(Asana)를 연동해 AI 인시던트 트리아지(incident triage) 에이전트를 구축하는 방법을 공개했다. 사이트 신뢰성 엔지니어(SRE)가 장애 발생 시 여러 도구를 오가며 증거를 수집하고 영향 범위를 파악한 뒤 후속 작업을 생성하는 과정을 하나의 대화형 워크플로로 통합하는 것이 목표다. 뉴 렐릭이 자체 서비스에 적용해 내부 테스트를 진행한 결과, 증거 수집 단계의 소요 시간이 단축되고 교대 근무 간 지식 손실 위험이 줄었으며 담당자가 누구든 일관된 조사 기준을 유지할 수 있었다고 밝혔다.
이 에이전트는 아마존 퀵의 채팅 에이전트 기능과 뉴 렐릭 MCP(모델 컨텍스트 프로토콜) 서버, 아사나 통합을 연결하는 구조다. 아마존 퀵에는 뉴 렐릭과 아사나가 기본 커넥터로 탑재돼 있어 별도 SDK 구현 없이 통합이 가능하다. 온콜 엔지니어가 “결제 서비스에서 서버 오류가 발생하고 있다. 최근 24시간을 검토해 RCA 브리핑을 생성하라”는 단일 프롬프트를 입력하면, 에이전트가 뉴 렐릭의 다섯 가지 추론 도구를 자동으로 호출한다. 핵심 경보 분석, 영향 받는 사용자 및 서비스 정량화, 오류 로그 추출, 느린 요청 파악, 자연어를 뉴 렐릭 쿼리 언어(NRQL)로 변환해 실행하는 작업이 순서대로 처리된다.

에이전트는 이 분석 결과를 종합해 요약, 영향 범위, 예상 트리거, 핵심 증거 링크, 권장 후속 조치 3가지를 담은 RCA 브리핑을 자동 생성한다. 사용자가 확인하면 해당 내용이 아사나의 SRE 인시던트 트리아지 프로젝트에 태스크로 등록돼 인수인계 준비가 완료된다. 아마존 퀵 프로페셔널 구독과 뉴 렐릭 계정, 아사나 OAuth 앱 설정이 사전 요건이다. AWS는 최소 권한 원칙을 적용해 뉴 렐릭 커넥터에 읽기 전용 계정을 사용하고 아사나 OAuth 범위를 해당 프로젝트로 제한하며 개인 식별 정보를 태스크에 포함하지 않도록 권고했다.
이 구축 사례는 엔터프라이즈 운영에서 AI 에이전트가 여러 도구 사이의 수동 조율을 대체하는 방향으로 발전하고 있음을 보여준다. 동일한 조사 형식을 담당자와 무관하게 일관되게 유지하면서 사후 검토도 더 체계적으로 진행할 수 있다는 것이 장점이다. AWS는 이 패턴을 인시던트 대응 외에도 다양한 엔터프라이즈 워크플로에 확장 적용할 수 있다고 설명했다.














