장거리 로봇 조작 태스크에서 정책 실패를 미리 감지하고 더 강력한 백업 정책으로 제어를 전환하는 시스템 ‘AEGIS(Activation-probe Early-warning, Gated Inference Switching)’가 arXiv에 공개됐다. 로봇이 복잡한 순차 조작을 수행할 때 한 번의 나쁜 동작이 이후 상태를 연쇄적으로 악화시키는 문제는 오랫동안 해결 과제였다. AEGIS는 실패가 실제로 발생하기 전에, 정책 신경망 내부의 활성화 패턴에서 이미 위험 신호가 나타난다는 관찰에서 출발한다.
AEGIS의 작동 방식은 약한 정책(weak policy)의 동결된 활성화값 위에 경량 프로브를 덧붙여 각 시점의 위험도를 실시간으로 추정하는 것이다. 위험 점수가 임계값을 넘으면 더 강한 정책(strong policy)으로 제어권이 선택적으로 위임되며, 위험이 해소되면 다시 약한 정책이 실행을 이어받는다. 이 구조 덕분에 강한 정책이 모든 단계에 개입하는 전면적 에스컬레이션과 달리 계산 비용을 크게 아낄 수 있다. 실험 결과 강한 정책은 전체 조작 단계의 38%에서만 활성화됐다.

LIBERO-Spatial 벤치마크에서 AEGIS는 약한 정책 단독으로 실패한 궤적의 10.1%를 복구하는 데 성공했다. 무작위 트리거 방식과 비교해 5.0 퍼센트포인트(p=1.0e-4), 무조건 에스컬레이션 방식 대비 5.4 퍼센트포인트(p=8.5e-6) 높은 성능을 기록했다. 이 연구는 물리적 AI 시스템의 신뢰성을 높이는 데 있어 외부 감독자를 추가하는 대신 정책 자체의 내부 상태를 감시하는 접근법이 효과적임을 보여준다. 제조·물류·수술 로봇처럼 실패 비용이 높은 실제 환경에서 활용 가능성이 주목된다.














