마이크로소프트 리서치(Microsoft Research)가 UC버클리·UC샌프란시스코·컬럼비아대학교와 공동으로 AI 뇌 예측 모델에서 언어 반응의 원인을 언어로 설명하는 새로운 기법을 개발했다. 생성적 인과 검증(Generative Causal Testing·GCT)으로 명명된 이 방법론은 대규모 언어 모델(LLM)이 뇌 활동을 정확히 예측하면서도 그 작동 원리를 인간이 읽을 수 있는 형태로 설명하지 못하는 ‘블랙박스’ 문제를 해결하기 위해 고안됐다. fMRI(기능적 자기공명영상) 스캐너에서 피험자가 이야기를 들을 때 LLM 내부 표현이 개별 대뇌 피질 패치의 활동을 높은 정확도로 예측하지만, 모델이 수백만 개의 비가독적 파라미터로 이루어져 있어 어떤 개념에 반응하는지 알 수 없다는 한계가 연구의 출발점이 됐다.
GCT는 이 문제를 두 단계로 접근한다. 먼저 뇌 예측 모델을 분석해 각 대뇌 피질 영역이 반응하는 내용을 “음식 조리” 또는 “지명”과 같은 짧은 언어적 설명으로 압축한다. 그다음 LLM이 특정 뇌 영역을 활성화하도록 설계된 새 이야기를 작성하고, 피험자가 이를 스캐너 안에서 들을 때 해당 영역이 실제로 반응하는지 확인해 설명이 맞는지 검증하는 폐쇄 루프 구조를 이룬다. 연구팀은 이 방법으로 기존에 알려진 뇌 영역의 선택적 반응을 재확인하고, 오랫동안 유사하다고 여겨졌던 인접 장소 처리 영역들을 구분해내는 데 성공했다. 또한 대화·시각·시간 측정값 등 특정 개념에만 반응하는 소규모 전전두엽 ‘마이크로 영역’도 새롭게 발견했다.

이 연구의 핵심 기여는 LLM의 예측 능력을 검증 가능한 과학적 가설 생성 도구로 전환했다는 점이다. 기존 방식에서는 뇌 모델의 성능 지표가 높아도 그 안에서 어떤 언어 특성이 뇌 반응을 이끄는지 규명하기 어려웠다. GCT는 설명을 먼저 언어로 만들고 그 설명을 실험으로 직접 검증함으로써, AI 모델의 해석 가능성과 신경과학적 발견을 동시에 추구하는 새로운 연구 경로를 제시했다. 연구 결과는 마이크로소프트 리서치 공식 블로그를 통해 공개됐으며, 언어 신경과학 분야에서 AI 기반 설명 가능성 연구의 방향을 제시하는 사례로 평가받고 있다.














