AI 챗봇 유용성 훈련이 인간 행동 시뮬레이션 능력을 약화시킨다
20만8000명·2600만 응답 분석 결과, RLHF 등 정렬 훈련이 LLM의 인간 행동 예측 정확도를 체계적으로 낮추는 것으로 나타났다.
20만8000명·2600만 응답 분석 결과, RLHF 등 정렬 훈련이 LLM의 인간 행동 예측 정확도를 체계적으로 낮추는 것으로 나타났다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.