MindZero: 주석 없이 마음 이론 추론 학습하는 강화학습 프레임워크

실제 세계에서 인간을 효과적으로 보조하려면 AI 에이전트가 사람의 행동으로부터 정신 상태를 추론하는 능력, 즉 ‘마음 이론(Theory of Mind, ToM)’을 갖춰야 한다. 그러나 현재의 AI 시스템에는 여러 핵심 과제가 남아 있다. 복수의 가설에 대한 온라인 불확실성 갱신, 실시간 보조에 적합한 효율적 추론, 그리고 실제 도메인에서 정신 상태 정답 주석의 부재가 대표적인 문제다. 이를 해결하기 위해 자기지도 강화학습 프레임워크인 ‘MindZero’가 arXiv에 발표됐다.

MindZero는 다중모달 대형 언어 모델(MLLM)을 효율적이고 견고한 온라인 정신 추론에 맞게 훈련시킨다. 훈련 중 모델은 관찰된 행동의 가능도를 계획기(planner)가 추정한 값이 최대화되도록 정신 상태 가설을 생성하면 보상을 받는다. 이는 모델 기반 마음 이론 추론과 유사한 구조로, 명시적 정신 상태 주석이 전혀 필요 없다. 훈련 완료 후 MindZero는 모델 기반 추론 능력을 내면화해 단일 패스 추론만으로 빠른 응답을 제공한다.

Screen displaying AI chat interface DeepSeek on a dark background. — 사진: Matheus Bertelli / Pexels

연구팀은 격자 세계(gridworld)와 가정용 환경(household domain)에서 정신 추론 및 AI 보조 과제를 대상으로 MindZero를 여러 기준 모델과 비교 평가했다. 그 결과 언어 모델 단독으로는 마음 이론 성능이 충분하지 않고, 모델 기반 방법이 정확도를 높이지만 처리 속도가 느리고 비용이 많이 들며 기반 MLLM 역량에 제한된다는 사실이 확인됐다. 반면 MindZero는 MLLM의 고유한 마음 이론 능력을 향상시키고 정확도와 효율성 두 측면에서 모델 기반 방법을 크게 앞섰다. 이는 정신 추론이 자기지도 기술로서 효과적으로 학습될 수 있음을 보여준다.

MindZero의 접근법은 마음 이론 관련 정답 레이블을 인간 전문가가 직접 수집할 필요가 없다는 점에서 실용성이 높다. 사람의 의도와 목표를 파악해야 하는 개인 보조 로봇, 의료 돌봄 에이전트, 사회적 상호작용이 필요한 AI 시스템 등에 활용될 수 있다. 주석 비용 없이 마음 이론 추론 능력을 자기지도 방식으로 습득하는 이 연구는 실제 환경에서 인간 중심 AI 에이전트 구현을 앞당기는 방향으로 평가된다.