전자 건강기록(EHR·Electronic Health Record)의 구조화된 종단 데이터와 대규모 언어 모델(LLM)의 자연어 추론 능력을 결합하는 멀티모달 프레임워크 ‘챗헬스AI(ChatHealthAI)’가 제안됐다. Wang Bo-Hong 등 연구팀이 arXiv에 발표한 논문에 따르면, LLM은 임상 의사결정 지원을 위한 강력한 자연어 추론 능력을 갖추고 있으나 구조화된 종단 EHR을 효과적으로 모델링하는 데 어려움을 겪는다. 반면 EHR 파운데이션 모델은 예측 환자 표현을 학습할 수 있지만 해석 가능한 언어 기반 추론 능력이 부족하다.
이 격차를 해소하기 위해 ChatHealthAI는 사전 학습된 EHR 파운데이션 모델의 구조화된 표현을 태스크 인식 리샘플러(task-aware resampler)를 통해 고정된 LLM의 의미 공간과 정렬한다. 이 과정에서 종단 환자 표현과 정제된 임상 이벤트 설명이 통합되어, 임상적으로 근거 있는 자연어 추론과 정확한 환자 예측이 동시에 가능해진다. 연구팀은 ChatHealthAI를 임상 예측 벤치마크인 EHRSHOT의 세 가지 예측 태스크에 적용해 평가했으며, 그 결과 추론 품질과 해석 가능성이 향상되면서도 경쟁력 있는 예측 성능을 유지하는 것을 확인했다.

이 연구는 EHR 파운데이션 모델과 사전 학습된 LLM을 통합해 해석 가능한 임상 예측을 실현하는 가능성을 보여준다는 점에서 주목받는다. 현재 의료 AI 분야에서는 모델의 높은 예측 성능과 임상의가 이해할 수 있는 설명 가능성을 동시에 확보하는 것이 핵심 과제로 꼽힌다. ChatHealthAI의 접근 방식은 구조화된 의료 데이터와 언어 모델 사이의 다리를 놓는 방향성을 제시한다. 연구팀은 이 연구 결과가 해석 가능한 임상 예측을 위한 EHR 파운데이션 모델과 LLM 통합의 잠재력을 부각시킨다고 밝혔다.














