NVIDIA BioNeMo, LoRA로 생물학 파운데이션 모델 단일 GPU 파인튜닝 가능

엔비디아(NVIDIA)가 생물학 특화 파운데이션 모델을 단일 워크스테이션 GPU에서 효율적으로 파인튜닝할 수 있는 ‘BioNeMo Recipes’를 공식 기술 블로그를 통해 공개했다. 이 프레임워크는 LoRA(Low-Rank Adaptation, 저랭크 적응) 기법을 적용해 수십억 개의 파라미터를 가진 모델을 전체 학습 없이 특정 생물학 과제에 맞게 조정하는 단계별 레시피를 제공한다.

공개된 사례 연구에서 BioNeMo Recipes는 두 가지 모달리티에 동일한 LoRA 레시피를 적용했다. 단백질 언어 모델 ESM2-3B는 단백질 2차 구조 예측(PSSP) 과제에서 Q3 정확도 84.80%, Q8 정확도 74.30%를 기록해 Porter 6 등 기존 전문 모델과 동등한 성능을 달성했다. DNA 언어 모델 Evo2-1B는 스플라이스 사이트 분류 과제에서 헤드만 학습한 기준선 52.3%에서 LoRA 적용 후 96.6%로 대폭 향상됐으며, 이 과정에서 전체 파라미터의 약 1.42%만 학습에 사용됐다. 처리 속도 측면에서는 시퀀스 패킹(THD 포맷) 방식을 적용해 기존 패딩 방식 대비 약 5.5배의 처리량 향상을 확인했다. 모든 실험은 단일 엔비디아 RTX 6000 블랙웰 워크스테이션 에디션 GPU에서 약 1시간 이내에 완료됐다.

BioNeMo Recipes는 PyTorch, Hugging Face, Megatron-Bridge 패턴을 기반으로 구성되며, 엔비디아 트랜스포머 엔진(TE)과 같은 성능 최적화 컴포넌트를 통합해 복잡한 분산 학습 설정 없이도 생물정보학 연구자들이 실용적인 수준에서 파인튜닝을 수행할 수 있도록 설계됐다. 단백질 구조 예측, 변이 효과 분석, 조절 요소 분류 등 다양한 생물학적 하위 작업에 동일한 패턴을 재사용할 수 있다는 점이 특징이다.

수십억 규모 생물학 파운데이션 모델을 고성능 클러스터가 아닌 워크스테이션 수준의 하드웨어에서 적용 가능하게 만든 이번 발표는 AI 기반 신약 개발, 유전체 분석, 단백질 공학 분야에서 진입 장벽을 낮추는 의미를 갖는다. 엔비디아는 BioNeMo Recipes 소스 코드와 튜토리얼을 공개 저장소를 통해 제공하고 있어 연구자들이 직접 재현하고 확장할 수 있다고 밝혔다.