RLHF 훈련이 AI의 인간 행동 시뮬레이션 능력을 약화시킨다
20만 8000명·2600만 응답 규모의 국제 연구에서 RLHF 등 사후 훈련이 AI의 인간 행동 예측 능력을 체계적으로 저하시킨다는 사실이 확인됐다.
20만 8000명·2600만 응답 규모의 국제 연구에서 RLHF 등 사후 훈련이 AI의 인간 행동 예측 능력을 체계적으로 저하시킨다는 사실이 확인됐다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.