수작업 실행 파이프라인이나 고비용 전문가 궤적에 의존하지 않고 웹 에이전트 스스로 한계를 발견하고 역량을 확장하는 자기개선 프레임워크인 SCALE이 arXiv(논문 번호 2605.31365)에 발표됐다. 이 연구는 멀티모달 대규모 언어 모델(MLLM) 기반 웹 에이전트가 복잡하고 동적인 환경에 적응하지 못하는 기존 문제를 해소하기 위해 설계됐다.
SCALE은 세 가지 대립적 역할—선택자(Selector), 예측자(Predictor), 판단자(Judger)—을 통해 에이전트가 자신의 한계를 자율적으로 파악하고 환경 탐색을 통해 인지적 경계를 확장하도록 한다. 또한 전역 계획을 지원하고 국소 탐색 함정을 회피하는 그래프 탐색 전략인 SCALE-Hop을 함께 제안했다. 학습 데이터 확보를 위해 다수의 실제 웹사이트에서 수집한 대규모 데이터셋 SCALE-20K를 구축했다. 이 데이터셋은 다양한 태스크 유형과 SCALE의 탐색 궤적에서 생성된 구조화된 시연 사례를 포함한다.

실험 결과 이 접근 방식은 다양한 웹 환경에서 여러 MLLM의 성능과 일반화 능력을 크게 향상시켰다고 연구팀은 보고했다. 기존 방법들이 특정 도메인의 전문가 데이터에 의존해 새로운 환경 적응이 제한됐던 것과 달리, SCALE은 실제 웹 환경 탐색을 통해 자체적으로 데이터를 생성하고 학습하는 확장 가능한 경로를 제시한다. 논문은 자율적이고 적응적인 웹 에이전트 구축을 위한 범용적이고 일반화 가능한 솔루션을 제공한다고 밝혔다.
국내 AI 개발팀 관점에서 SCALE이 주목받는 이유는 레이블된 전문가 데이터 부재 상황에서도 자기지도적으로 웹 에이전트를 개선할 수 있는 경로를 제시하기 때문이다. 쇼핑, 정보 검색, 업무 자동화 등 웹 기반 서비스 에이전트를 개발하는 팀이라면 SCALE-20K 데이터셋과 SCALE-Hop 탐색 전략을 자체 도메인 적용 실험의 기반으로 삼을 수 있다. 전문가 궤적 수집 비용 절감과 도메인 특화 학습을 동시에 추구하는 접근으로서 실용적 가치가 있다.


