임상 생체지표만으로 알츠하이머 3단계 분류 AUC 0.982 달성

전 세계 5,500만 명 이상이 앓고 있는 알츠하이머병(AD) 조기 진단에 설명 가능한 머신러닝 모델을 적용한 연구 결과가 발표됐다. 알츠하이머병 신경영상 이니셔티브(ADNI) 데이터셋을 활용해 정상 인지(NC), 경도 인지 장애(MCI), 알츠하이머병 3단계를 분류하는 XGBoost 기반 모델을 개발한 결과, 유지 테스트 세트(247명)에서 거시 평균 AUC 0.982(95% 신뢰구간: 0.965~0.995), 정확도 0.943, 코헨 카파 0.909를 기록했다.

모델은 MMSE, CDR 글로벌, CDR 박스 합계(CDR-SB), MoCA, FAQ, 나이, 성별, 교육 수준 등 8개 임상 특징만을 입력으로 사용한다. 클래스 불균형 문제는 SMOTE로 처리했고, 하이퍼파라미터 최적화는 50회 시도의 Optuna를 활용했다. 5중 교차검증에서 거시 평균 AUC 0.983(표준편차 0.007), 거시 F1 0.929(표준편차 0.008)를 보였다. SHAP(SHapley Additive exPlanations) 분석을 통한 특징 중요도 분석에서는 CDR 글로벌이 NC와 MCI 분류에서 주요 예측 인자로, CDR-SB와 MMSE가 AD 분류를 주도하는 것으로 확인됐다.

Two male radiologists standing in a medical facility with MRI scanner. — 사진: MART PRODUCTION / Pexels

이 연구가 주목받는 이유는 고가의 영상 장비나 침습적 검사 없이 일상적인 임상 평가만으로 높은 정확도를 달성했다는 점이다. 기존 알츠하이머 진단 연구 상당수가 MRI나 PET 영상에 의존하는 반면, 이 모델은 실제 임상 현장에서 이미 수집하는 인지 검사 점수와 기본 인구통계학적 정보만을 활용한다. SHAP 분석이 제공하는 예측 근거의 투명성도 임상 의사결정 지원 도구로서의 실용성을 높인다.

연구진은 1,641명의 기준선 피험자(NC 608명, MCI 767명, AD 266명) 데이터를 바탕으로 한 이번 결과가 임상 타당성을 뒷받침하는 특징 중요도 패턴을 보인다고 평가했다. 향후 연구에서는 언어 생체지표를 추가한 다중 모달 탐지로 프레임워크를 확장할 계획이다.