인공지능(AI) 분야에서 의사결정을 추론 문제로 다루는 ‘능동 추론(Active Inference)’ 프레임워크의 수학적 기반을 정밀하게 재정립한 연구가 arXiv에 게재됐다. 능동 추론은 기대 자유 에너지(EFE, Expected Free Energy)를 최소화함으로써 목표 지향적 행동과 정보 탐색 행동을 하나의 원리로 통합하는 접근법이다. 연구팀은 EFE 최소화가 인식론적 사전 분포(epistemic priors)로 보강된 생성 모델 위에서 변분 자유 에너지(VFE, Variational Free Energy) 최소화로 표현될 수 있다는 선행 연구를 바탕으로, 두 목적 함수 사이의 정확한 관계를 수학적으로 증명했다.
연구의 핵심 기여는 보강된 모델의 VFE가 예측 모델의 VFE와 명시적인 엔트로피 보정 항의 합으로 분해된다는 점을 보인 것이다. 이를 통해 EFE 기여분을 투명하게 드러낼 수 있다. 더 나아가, 완전한 EFE 기반 계획을 위해서는 이 엔트로피 보정에 더해 주변 추론을 정책 최적화로 전환하는 ‘계획 보정(planning correction)’을 결합해야 한다는 사실도 도출했다. 이 분석은 교차 엔트로피 계획과 완전한 EFE 기반 계획 각각에 필요한 보정이 무엇인지를 명확히 구분해준다.

연구팀은 같은 엔트로피 보정 공식으로부터 EFE 기반 계획을 위한 상세한 메시지 전달(message-passing) 방식과 더 단순한 절제(ablation) 변형들을 함께 도출했다. 세 가지 그리드 월드(grid-world) 환경에서 진행한 실험에서는 계획 보정이 관측이 명확한 상황에서 이미 성능을 높이며, 관측이 모호한 상황에서는 추가적인 관측 측 인식론적 보정이 더 중요하다는 사실이 확인됐다. 이 연구는 능동 추론이 어떤 종류의 추론인지를 수리적으로 해명함으로써, 강화학습(RL)과 베이즈 추론을 연결하는 이론적 토대를 강화한다.













