• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

허깅페이스, 1조 매개변수 가중치를 ‘Hub 버킷’으로 전송… 강화학습 비용 절감

STORIUM 편집부 작성: STORIUM 편집부
2026년 05월 30일 17시 45분
Home AI 모델·연구
Share on FacebookShare on Twitter

허깅페이스가 대규모 강화학습(RL)에서 모델 가중치를 효율적으로 동기화하는 오픈소스 방식을 공개했다. 비동기 RL의 비용을 크게 낮출 수 있는 접근으로, 학습기(trainer)가 갱신한 새 가중치를 추론 엔진(inference engine)으로 빠르게 옮기는 것이 핵심이다. 가중치 전송이 늦으면 추론 엔진이 학습 정책에서 점점 벗어나기 때문에, 이 전송은 동기·비동기를 막론하고 작업의 병목 구간에 놓인다.

핵심 통찰은 ‘학습 한 스텝에서 실제로 바뀌는 가중치는 2%에 불과하다’는 점이다. 처음엔 데모에서만 통할 법한 수치처럼 들리지만, 이는 bf16 연산이 RL이 쓰는 학습률에서 작동하는 방식에서 자연히 따라 나온다. bf16 수는 가수부 비트가 7개뿐이라, RL 학습률 수준의 미세한 갱신은 반올림에 흡수돼 바이트 표현이 바뀌지 않는다. 즉 대부분의 가중치는 실제로 변하지 않는다.

Concept of machine learning
출처: Wikimedia Commons / CC BY-SA 4.0

허깅페이스는 변한 가중치만 골라 전송하기 위해, 갱신된 부분(델타)만 공유 ‘Hub 버킷’에 올리는 방식을 택했다. 학습기는 쓰고, 추론 복제본들은 읽으며, Hub가 중간 연결을 처리한다. 이는 일부 기업이 쓰던 ‘공유 스토리지 버킷’ 방식의 오픈소스 등가물로, 콘텐츠 해싱과 권한 관리가 이미 갖춰져 있어 기존 스택과 자연스럽게 결합된다.

실제로 연구진은 서로 다른 네트워크에 있는 세 대의 머신으로 완전히 분산된 학습을 돌렸다. 학습기는 포트를 열지 않고, 추론 서버는 학습기의 주소를 모르며, 모두가 Hub를 통해서만 통신한다. 전송되는 델타 용량은 20~35MB 수준으로 유지됐고, 동기화 때 추론이 멈추는 시간은 약 1초에 머물렀다. 지구 어디서든 HTTPS만 가능하면 학습을 시작할 수 있다는 의미다.

이 방식은 대규모 모델 학습 인프라의 진입장벽을 낮춘다는 점에서 의미가 크다. 값비싼 전용 네트워크 없이도 분산 강화학습을 돌릴 수 있게 되면서, 자원이 제한된 연구실이나 스타트업도 대형 모델 후속 학습을 시도할 여지가 생긴다. 오픈소스 인프라를 활용하려는 국내 AI 연구 현장에도 실용적 참고가 되는 사례다.

Tags: vLLM강화학습분산 학습오픈소스허깅페이스
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
美 수사당국, '반기술 극단주의'를 새 위협으로 지목

美 수사당국, '반기술 극단주의'를 새 위협으로 지목

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI 검색 AI과학 AI규제 AI안전 AI 에이전트 AI에이전트 AI 인프라 AI 코딩 Anthropic AWS Claude Co-Scientist Gemini IPO LLM OpenAI SynthID 검색 구글 구글 딥마인드 기업공개 노동시장 데이터센터 딥시크 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 생산성 스노우플레이크 스타트업 투자 스페이스X 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 오픈소스 로봇 중국 챗GPT 클라우드 클로드 허깅페이스

최근 뉴스

유럽의회 스트라스부르 루이즈 바이스 건물 반원형 의회장 내부

EU AI법 옴니버스 합의: 기한 최대 16개월가량 연장, 딥페이크 신규 금지

2026년 05월 30일 21시 11분
그로크 LPU v1 칩 다이 사진

그로크, 기존 투자자 대상 6.5억 달러 추가 조달 추진

2026년 05월 31일 00시 20분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.