LLM, 거짓 경고에도 허위 진술 사실로 받아들인다
LLM이 거짓이라는 명시적 경고가 붙은 학습 데이터에서도 허위 진술을 사실처럼 흡수한다는 연구가 나왔다.
LLM이 거짓이라는 명시적 경고가 붙은 학습 데이터에서도 허위 진술을 사실처럼 흡수한다는 연구가 나왔다.
텍사스 홀덤 포커 시뮬레이터를 통제 환경으로 활용한 연구에서 LLM 에이전트가 추론 과정에서 도달한 결론과 실제 행동 사이에 체계적인 충실도 격차가 ...
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.