MS 리서치, 소형 모델용 에이전트 시스템 매젠틱라이트·파라1.5 공개

마이크로소프트 리서치(MS 리서치) AI 프런티어스가 소형 모델에 최적화된 실험적 에이전트 애플리케이션 매젠틱라이트(MagenticLite)를 공개했다. 기존 매젠틱-UI(Magentic-UI)의 다음 세대로, 웹 브라우저와 로컬 파일 시스템을 하나의 워크플로 안에서 함께 다룬다. 이 시스템은 추론·위임·터미널 작업을 맡는 매젠틱브레인(MagenticBrain)과 브라우저 작업을 처리하는 컴퓨터 사용 모델 파라1.5(Fara1.5)라는 두 전용 모델로 구동되며, 세 구성 요소가 단일 시스템으로 함께 작동하도록 설계됐다.

핵심 연구 가설은 에이전트 능력이 지식의 양보다 도구를 조율하고 행동하는 능력에 달려 있다는 것이다. MS 리서치는 이 통찰 덕분에 더 작은 모델로도 비용을 크게 낮추면서 폭넓은 작업을 수행할 수 있다고 설명했다. 매젠틱브레인은 큐원(Qwen) 3 14B를 미세조정한 140억 파라미터 조율 모델로, 모호한 요청을 구체적 계획으로 바꾸고 단계마다 적절한 도구나 하위 에이전트를 고른 뒤 필요하면 코드를 직접 작성하고, 작업 중 문제가 생기면 복구한다. 훈련 때 쓴 도구 형식과 실행 환경을 추론 시점과 동일하게 맞춰, 학습 방식과 실제 작동 사이의 간극을 없앴다.

Figure 6 – MagenticBrain.png | A flow diagram illustrating MagenticBrain's role as an orchestration model. At the top, a box represents the user's natural-language request: — 이미지 출처: 원문 (MagenticLite: An agentic experience optimized for small models)

파라1.5는 컴퓨터 사용 모델 계열의 차세대 버전으로, 큐원 3.5를 기반으로 40억·90억·270억 파라미터 세 종이 제공되며 대다수 용도에는 90억 파라미터 기본 모델이 권장된다. 이 모델은 소형 컴퓨터 사용 모델 가운데 최고 수준(SOTA) 성능을 달성했으며, 300개 과제로 구성된 온라인-마인드2웹(Online-Mind2Web) 벤치마크에서 동급 모델을 모두 앞섰고 이전 버전 파라-7B의 웹 탐색 성능을 거의 두 배로 끌어올렸다. 270억 파라미터 변형은 같은 벤치마크에서 90%를 넘는 성능을 기록했다. 양식 작성, 자격 증명이 필요한 사이트 로그인, 예약 같은 일상 작업 처리 능력도 개선됐다.

이 시스템의 또 다른 축은 소형 모델을 위해 다시 만든 실행 하네스다. 작은 모델은 유효 컨텍스트 창이 좁고 정보가 늘수록 성능이 빠르게 떨어지므로, 하네스는 각 단계에서 모델이 받을 정보를 능동적으로 추려 프롬프트를 집중시키고 이전 상호작용을 요약으로 압축한다. 또 조율자가 모든 작업을 직접 처리하지 않고 브라우저 작업을 파라1.5에 넘기는 하위 에이전트 위임 구조를 통해 각 모델이 더 좁고 전문화된 부분을 맡도록 했다. 거래나 로그인, 되돌릴 수 없는 제출 같은 중요한 지점에서는 매젠틱-UI 1.0과 마찬가지로 사용자의 명시적 승인을 위해 작업을 멈춘다.

이번 발표가 주목되는 까닭은 거대 모델에 의존하던 에이전트 작업을 사용자 기기에서 직접 돌릴 만큼 작은 모델로 끌어내리려는 시도이기 때문이다. 전체 시스템은 QEMU 기반 샌드박스를 감싼 오픈소스 래퍼 퀵샌드(Quicksand) 안에서 실행돼 브라우저 세션과 코드 실행을 호스트 시스템에서 격리하며, 데이터를 사용자 기기에 두는 방향을 지향한다. 매젠틱라이트는 깃허브에, 매젠틱브레인과 파라1.5는 마이크로소프트 파운드리에 연구용으로 공개됐고, MS 리서치는 폭넓은 실험과 평가, 피드백을 위해 이를 내놨다고 밝혔다.