메타 AI 고객지원 에이전트 해킹, AI 보안 취약점 경각심 높여

공격자들이 메타(Meta)의 AI 기반 고객지원 에이전트를 이용해 인스타그램 계정을 대량 탈취한 사실이 2026년 6월 초 보도를 통해 드러났다. 공격 방식은 매우 단순했다. 공격자들이 해당 에이전트에게 계정에 연결된 이메일 주소를 자신이 통제하는 주소로 바꿔달라고 요청하자, 에이전트가 아무런 추가 인증 절차 없이 이를 이행한 것이다. 오바마 전 대통령 백악관 계정이 탈취돼 친이란 게시물이 올라오는 등 피해가 발생했으며, 거래 가치가 높은 단어 하나짜리 핸들 계정들도 타깃이 됐다.

보안 전문가들은 이번 사건이 앤트로픽(Anthropic)의 마이토스(Mythos) 모델처럼 강력한 해킹 능력을 갖춘 AI가 아니라, 오히려 AI 에이전트 자체가 공격 대상이 된 상황이라는 점에서 주목할 만하다고 평가했다. 듀크대학교 전기·컴퓨터공학과 닐 공(Neil Gong) 교수는 AI가 업무 자동화에 더 널리 활용될수록 공격자들이 AI 시스템 자체를 겨냥하는 동기도 강해질 것이라고 경고했다. 위스콘신-매디슨대 컴퓨터공학과 소메시 자(Somesh Jha) 교수는 사람이라면 이메일 변경 요청 시 보안 질문으로 대응했을 상황에서 AI 에이전트가 오직 작업 완료에만 집중했다고 지적했다.

이번 사건은 AI 에이전트가 가진 구조적 취약성을 드러낸다. 전통적 소프트웨어와 달리 에이전트는 새로운 상황에 유연하게 반응하는 특성을 갖는데, 바로 이 유연성이 예기치 못한 방식으로 속임수에 활용될 수 있다. 전문가들은 배포 전 공격 시나리오를 스스로 시험하는 레드팀(Red-teaming) 과정을 엄격히 거치고, 민감한 계정 정보 변경 전 반드시 보안 질문을 요구하는 등 전통 소프트웨어 방식의 안전장치를 에이전트에 결합해야 한다고 조언했다. 메타 측은 해당 취약점이 해결됐다고 밝혔으나 구체적인 원인 분석은 공개하지 않았다.

AI 모델의 성능이 향상될수록 방어가 쉬워질 수 있다는 시각도 있다. 보다 정교한 모델이라면 오바마 전 대통령 계정의 이메일 변경 요청을 의심스러운 행위로 판단했을 가능성이 있기 때문이다. 그러나 전문가들은 기업들이 경쟁에서 뒤처지지 않기 위해 AI 에이전트에 더 많은 권한을 부여하려는 압박을 받는 상황에서, 보안과 기능성 사이의 균형을 유지하는 일이 앞으로 더욱 까다로운 과제가 될 것이라는 데 의견을 모았다.