NVIDIA, 대규모 3D 의료영상 합성 프레임워크로 의료 AI 훈련 병목 해소

NVIDIA가 고해상도 3D CT·MRI 의료영상을 대규모로 합성할 수 있는 오픈소스 프레임워크 ‘NV-Generate-CTMR’과 세계 최대 규모의 공개 다중모달 뇌 MRI 데이터셋 ‘MR-RATE’를 공개했다. 의료 AI 모델 훈련에서 가장 큰 장애물로 꼽혀온 데이터 부족·개인정보 제약·주석 비용 문제를 합성 데이터 생성으로 해결하겠다는 전략이다.

NV-Generate-CTMR은 NVIDIA가 2024년 발표한 생성 모델 MAISI(Medical AI for Synthetic Imaging) 아키텍처를 기반으로 구축됐다. 이 프레임워크는 유연한 복셀 크기, 가변 볼륨 크기, 전신 커버리지를 단일 모델 안에서 지원하는 최초의 오픈소스 의료영상 생성 프레임워크로 소개된다. 연구자는 즉시 사용 가능한 합성 영상을 생성하거나, 새 해부학·스캐너·모달리티에 맞게 모델을 파인튜닝할 수 있다. 코드·데이터·모델 가중치는 NVIDIA 오픈 모델 라이선스 등 오픈소스 라이선스로 제공되며, NVIDIA RTX GPU에서 로열티 없이 실행 가능하다. 이번 공개와 함께 선보인 NV-Generate-MR-Brain은 인간 뇌 해부학과 분절 구조 합성에 특화된 신규 모델이다.

A woman analyzes medical diagnostics on screen in a black and white office setting. — 사진: Tima Miroshnichenko / Pexels

MR-RATE 데이터셋은 취리히대학교, 메디폴대학병원, 포리스무스(Forithmus), NVIDIA가 공동으로 구축했다. 8만 3천 명 이상의 환자로부터 수집한 10만 건의 뇌 MRI 연구를 포함하며 총 70만 개 이상의 볼륨, 비식별화된 방사선 보고서, 임상 및 DICOM 메타데이터가 쌍을 이루도록 설계됐다. 다양한 스캐너 유형, 촬영 프로토콜, 신경학적 병리를 아우르며 실제 임상 신경영상 환경의 다양성을 반영했다. 데이터셋은 CC-BY-NC 라이선스로 연구기관에 공개되며, 상업적 이용은 포리스무스를 통해 별도 계약으로 제공된다.

의료 AI 분야에서 합성 데이터는 한정된 훈련 세트를 보강하고, CT와 MRI 등 모달리티 간 변환을 가능하게 하며, 희귀 병리를 시뮬레이션하고 실제 환자 정보 없이 데이터를 공유할 수 있게 한다는 점에서 핵심 기술로 부상하고 있다. NVIDIA는 임상 영상이 점점 더 개인화·이기종화·다중모달화되는 환경에서 확장 가능하고 제어 가능한 생성 프레임워크가 선택이 아닌 필수 인프라라고 강조했다. 향후 MAISI 아키텍처를 기반으로 한 추가 모델과 멀티모달 파운데이션 모델 개발도 이어질 전망이다.