No Result

View All Result

No Result

View All Result

No Result

View All Result

Home Tag RLHF

[태그:] RLHF

확산모델 RLHF, 피드백 6배 아껴 학습한다…선택적 가중·재생 기법 제안 논문 원문에 수록된 연구 도식

확산모델 RLHF, 피드백 6배 아껴 학습한다…선택적 가중·재생 기법 제안

작성: 유지율 리포터

2026년 07월 10일 09시 14분

사람·보상모델 피드백을 대량으로 요구하던 확산모델 RLHF의 비효율을 줄이는 두 기법이 공개됐다. 정보량 큰 구간에 집중해 표본 효율을 최대 6배 끌어올렸다.

Mastering Agentic Techniques: AI Agent Reinforcement Learning | NVIDIA Technical Blog

엔비디아, AI 에이전트 강화학습 실전 가이드 공개…네모트론 활용법 제시

작성: 한이준 리포터

2026년 07월 02일 19시 27분

엔비디아가 기업이 특정 업무에 맞춘 AI 에이전트를 훈련할 때 강화학습을 언제, 어떻게 적용해야 하는지 정리한 실전 가이드를 공개했다.

Large crowd gathered for an outdoor celebration with balloons and flags, enjoying a lively festival atmosphere.

MIT, 선호 예측 정확도 높이려면 2개 비교 대신 3개 비교가 필요

작성: 유지율 리포터

2026년 06월 15일 17시 04분

MIT 연구팀이 선호 예측에 쓰이는 확률적 효용 모델의 정확도를 높이려면 쌍 비교 대신 3개 옵션 비교가 필수적임을 수학적으로 증명했다.

a very long line of yellow lines on a black background

해석가능성으로 사후 훈련 신호 설계, LLM 과잉 스타일화 억제

작성: 유지율 리포터

2026년 06월 12일 19시 42분

연구팀이 해석가능성 기법을 활용해 언어 모델 사후 훈련 데이터를 감사하고 학습 신호를 직접 설계하는 파이프라인을 제안했다. 과잉 스타일화와 아첨 현상 ...

A mesmerizing display of glowing neon blue optical fibers creating a futuristic atmosphere.

LLM 사전학습 모델에 잠재된 자기평가 능력, 소량 데이터로 이끌어낸다

작성: 유지율 리포터

2026년 06월 06일 15시 18분

기반 LLM이 외부 심사 모델의 채점을 예측하는 잠재적 자기평가 능력을 갖추고 있으며, 160개 사례만으로 이를 활성화할 수 있다는 연구가 발표됐다.

Close-up of a person pointing at a vintage oscilloscope screen in a tech setting.

루브릭 기반 강화학습의 보상 해킹 재현·탐지 환경 CHERRL 제안

작성: 유지율 리포터

2026년 06월 05일 15시 23분

연구팀이 LLM 심판 기반 강화학습에서 발생하는 보상 해킹을 체계적으로 재현하고 탐지하는 제어 환경 CHERRL을 제안했다. 심판 모델의 편향이 어떻게 악용되는지 ...

A multi-ethnic group of professionals reviewing documents together in a corporate setting.

다중 AI 모델 협의 프로토콜 ‘Consilium’, 인식 편향 측정

작성: 유지율 리포터

2026년 06월 02일 12시 18분

비잔틴 장애 허용 기법을 적용한 다중 모델 협의 프로토콜이 RLHF 정렬 모델에서 영역별 인식 맹점을 실증적으로 확인했다.

여성 얼굴에 바이너리 코드가 투영된 디지털 개념 이미지 — AI 챗봇 인간 행동 시뮬레이션

AI 챗봇 유용성 훈련이 인간 행동 시뮬레이션 능력을 약화시킨다

작성: 유지율 리포터

2026년 06월 01일 20시 36분

20만8000명·2600만 응답 분석 결과, RLHF 등 정렬 훈련이 LLM의 인간 행동 예측 정확도를 체계적으로 낮추는 것으로 나타났다.

Colorful abstract representation of digital biology using CGI techniques, showca

RLHF 훈련이 AI의 인간 행동 시뮬레이션 능력을 약화시킨다

작성: 유지율 리포터

2026년 06월 01일 16시 41분

20만 8000명·2600만 응답 규모의 국제 연구에서 RLHF 등 사후 훈련이 AI의 인간 행동 예측 능력을 체계적으로 저하시킨다는 사실이 확인됐다.

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

최근 뉴스

엔비디아·37개 창립 파트너, Open Secure AI Alliance 출범

2026년 07월 28일 19시 45분

미국 연방 로비가 이뤄지는 워싱턴 의사당 공식 사진

미 주요 기술·AI 기업·단체 11곳, 상반기 로비 4,180만달러

2026년 07월 28일 18시 46분

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 | 사업자등록번호: 579-27-02025 | 대표자: 이국환
발행·편집인: 이국환 | 청소년보호책임자: 이국환 | 발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result

View All Result

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 | 사업자등록번호: 579-27-02025 | 대표자: 이국환
발행·편집인: 이국환 | 청소년보호책임자: 이국환 | 발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.