• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

약한 모델 쌍 선호도 신호를 LoRA로 합성해 강한 LLM 성능 높이는 PDA 기법

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 02일 17시 15분
Home AI 모델·연구
Share on FacebookShare on Twitter

강력한 대규모 언어 모델(LLM)을 훈련하려면 고품질 감독 데이터가 필요하지만 이는 종종 부족하다. 최근 연구는 소형·초소형 모델 쌍(예: Qwen3 4B와 1.7B)의 상대적 품질 차이, 즉 ‘약한 신호’도 유효한 감독 신호가 될 수 있음을 보여줬다. 이 아이디어를 확장해 여러 약한 신호를 집적함으로써 더 큰 모델(예: Qwen3 8B)의 성능을 끌어올릴 수 있는지를 탐구한 논문이 arXiv(2606.00357)에 게재됐다.

연구팀이 제안한 선호 델타 집적(PDA, Preference Delta Aggregation) 프레임워크는 세 단계로 구성된다. 각 약한-초소형 모델 쌍에서 선호 델타를 추출하고, 이를 선호 최적화를 통해 학습한 LoRA 어댑터로 구현한 뒤, 여러 어댑터를 LoRA 병합(merging)으로 집합시킨다. 이 과정에서 LoRA 병합 시 발생하는 방향 간섭 문제를 완화하기 위해 기하학적 정렬 병합(GAM, Geometric Alignment Merging) 방법도 함께 제안했다. GAM은 집합 전에 어댑터 부분 공간을 정렬해 다양한 델타들의 합성을 더 강건하게 만든다.

Businesswoman presenting on a whiteboard explaining financial concepts indoors.
사진: RDNE Stock project / Pexels

지식 추론 및 에이전트 검색 벤치마크에서 PDA와 GAM을 결합한 결과, 강한 모델의 지식 추론 능력이 평균 6.8포인트, 에이전트 검색 능력이 7.3포인트 향상됐다. 단일 델타 기준선과 다중 델타 기준선 모두를 상회했으며, 최고 성능 단일 델타 기준선 대비 각각 2.1포인트와 4.3포인트를 추가로 앞섰다. 약한 신호가 많아질수록 성능 향상이 누적되는 것도 확인됐다. 데이터·계산 자원이 제한된 환경에서 기존 소형 모델들을 활용해 대형 모델의 능력을 확장하는 실용적 방향을 제시했다는 점에서 의미 있는 연구다.

Tags: LLM훈련LoRA모델병합선호최적화약한지도학습
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
A legal professional's workspace featuring Lady Justice statue, documents, and a laptop.

인도 법원, 구글 키워드 광고에 상표권 침해 판결…창업자들 가세

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Co-Scientist Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 거버넌스 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 스타트업 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 자율주행 클라우드 클로드 허깅페이스 휴머노이드

최근 뉴스

Minimalist display of OpenAI logo on a screen, set against a gradient blue background.

오픈AI 코덱스, 윈도우 PC 자율 조작… 버그 찾고 앱 테스트

2026년 06월 02일 20시 34분
Detailed close-up of a microprocessor circuit board showcasing intricate circuitry and components.

엔비디아 X-Token, 토크나이저 달라도 지식증류… 정확도 6배

2026년 06월 02일 20시 12분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.