• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

Trajectory, 멀티-LoRA 연속학습 스택 SkyRL 오픈소스 공개… 실험 처리량 2.81배

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 01일 19시 24분
Home AI 모델·연구
Share on FacebookShare on Twitter

AI 스타트업 Trajectory가 UC Berkeley Sky Lab, Anyscale과 공동으로 개발한 멀티-LoRA(저랭크 적응) 연속학습 플랫폼 ‘C-LoRA(Continuous LoRA)’를 NovaSky-AI/SkyRL 깃허브 저장소에 오픈소스로 공개했다. 2026년 5월 27일 공개된 기술 보고서에 따르면, 단일 H200 노드에서 8개 실험을 동시에 처리했을 때 기존 단일 테넌트(single-tenant) 직렬 방식 대비 최종 실험 완료 시간이 2.81배 빨라졌으며 보상 정확도의 손실은 전혀 없었다.

C-LoRA의 핵심 아이디어는 매번 GPU를 새로 할당하고 체크포인트를 재로드하는 ‘콜드스타트’ 방식을 버리고, 항상 켜진 단일 추론·훈련 엔진 위에 각 실험을 별도의 LoRA 어댑터로 매핑하는 것이다. 추론 단계에서는 vLLM의 SGMV 디코드 커널이 여러 어댑터의 행렬-벡터 연산을 하나의 GPU 커널 호출로 융합해 서로 다른 어댑터의 토큰을 같은 배치에서 처리하며, 훈련 단계에서는 활성 어댑터 하나가 GPU를 점유하는 동안 나머지 어댑터의 상태는 핀드(pinned) CPU 메모리에 대기시킨다. 이 구조 덕분에 대규모 모델(Qwen3.5-397B 기준 H200 8노드 필요)도 LoRA의 메모리 절감 효과와 다중 실험 병렬 실행의 처리량 이득을 동시에 누릴 수 있다.

파란 조명이 켜진 서버 랙 인프라
사진: panumas nikhomkhai / Pexels

Trajectory가 단일 H200 노드에서 Qwen3-4B-Instruct-2507을 사용해 GSM8K 도구 사용 벤치마크로 검증한 결과, 8개 병렬 실험(N=8)의 전체 완료 시간은 직렬 실행 8회 대비 2.81배 단축됐다. 평균 실험 완료 시간도 N=4 기준 1.88배 향상됐다. 반면 트레이드오프도 존재한다. N=4에서 단일 스텝당 훈련 시간이 2.22배 늘어났고, 스텝 시간 증가분의 약 77%는 추론(롤아웃) 경로에서 발생했다. N=2 시나리오에서는 롤아웃 시간이 15%만 증가하면서도 스텝당 LoRA 처리량은 약 2배에 달해, 유휴 GPU를 채우는 이상적인 활용 사례로 제시됐다. 정확도 측면에서는 N=1·2·4·8 모든 동시성 수준에서 9스텝 이내에 보상 정확도 90% 이상을 달성해 병렬화로 인한 학습 품질 저하가 없음을 확인했다.

Trajectory는 이 시스템이 ‘월 단위 재학습’이 아닌 ‘시간 단위 지속 업데이트’를 가능하게 하는 연속학습 인프라의 초기 설계라고 밝혔다. 현재는 중간 규모 모델(Qwen3-4B, Nemotron-30B MoE) 수준에서 검증됐으며, 향후 어댑터 동시 실행 수 확대, 수조 파라미터 규모 모델 적용, 훈련 단계에서의 다중화 등을 연구 방향으로 제시했다. 코드베이스는 SkyRL 저장소에서 누구나 내려받을 수 있으며, 8×H100/H200 노드와 CUDA 12.8 이상 환경에서 즉시 실행 가능한 런처 스크립트도 함께 제공된다.

Tags: LLMLoRASkyRLUC Berkeley강화학습연속학습오픈소스
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
데이터센터 서버 랙과 케이블 배선 — AI 전력 수요와 에너지 산업

AI 전력 수요가 에너지 산업 판도를 바꾼다

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI과학 AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic AWS ChatGPT Claude Co-Scientist IBM IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 기업공개 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 생산성 생성형AI 스페이스X 아마존 앤트로픽 에이전트 엔비디아 엔터프라이즈 오픈AI 오픈소스 중국 클라우드 클로드 허깅페이스

최근 뉴스

데이터센터 서버 랙과 케이블 배선 — AI 전력 수요와 에너지 산업

AI 전력 수요가 에너지 산업 판도를 바꾼다

2026년 06월 01일 20시 00분
AI 멀티모달 모델 추상 흑백 다이어그램 — 멀티-LoRA 학습 아키텍처

Trajectory, 멀티-LoRA 연속학습 스택 SkyRL 오픈소스 공개… 실험 처리량 2.81배

2026년 06월 01일 19시 24분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.