MIT 연구팀이 인간 선호를 예측하는 수학 모델인 확률적 효용 모델(RUM)의 오랜 한계를 극복하는 이론적 돌파구를 제시했다. 전기공학·컴퓨터과학과 가브리엘레 파리나 교수 등 MIT 연구자들이 4월 리우데자네이루에서 열린 국제 학습 표현 컨퍼런스(ICLR)에서 발표한 이 연구는, 두 가지 선택지 간의 쌍(pair) 비교만으로는 선호 간 상관관계를 추출하는 것이 수학적으로 불가능함을 증명했다. 1927년 심리학자 서스턴이 제안한 이래 거의 100년간 쌍 비교가 표준으로 사용돼온 분야에서 근본적 한계를 지적한 것이다.
핵심 발견은 세 가지 선택지를 선호 순서로 평가할 때 비로소 선호들 사이의 상관관계를 추출할 수 있다는 점이다. 예를 들어 총기 규제를 지지하는 유권자가 정부 보육 지원도 선호할 가능성이 높거나, 독립 영화 팬이 외국 영화에는 호의적이면서 할리우드 액션 영화에는 소극적인 패턴 같은 정보가 쌍 비교만으로는 드러나지 않는다. 연구팀은 이런 상관관계를 포착하는 효율적인 알고리즘이 가능하며, 필요한 실험 횟수가 데이터베이스 항목 수에 따라 지수적으로 늘어나지 않는다는 사실도 확인했다.
이 연구는 AI 모델 정렬 분야와 직결된다. LLM(대규모 언어 모델) 훈련에서 사람에게 모델 출력 결과를 비교·순위 매기도록 하는 인간 피드백 강화학습(RLHF)이 널리 쓰이는데, 여기서도 주로 쌍 비교 방식을 채택한다. MIT 연구팀은 3가지 선택지를 순서대로 평가하는 데이터를 활용하면 AI 모델 정렬의 정확도가 더 높아질 수 있다고 강조했다. 상호 연결된 무수한 선택지가 쏟아지는 현대 디지털 환경에서 플랫폼의 추천 정확성을 근본적으로 향상시키는 데 이 발견이 기여할 수 있다는 분석이다.














