저항하는 내담자 시뮬레이터로 AI 심리상담 평가 개선 연구

대규모 언어 모델(LLM)을 심리 상담에 활용하려는 연구가 활발해지는 가운데, 기존 평가 방식의 근본적 허점을 짚은 논문이 공개됐다. 연구진은 현재 심리상담 AI 벤치마크들이 지나치게 협조적인 가상 내담자만을 전제로 설계됐다는 점에 주목했다. 이런 내담자들은 상담사의 몇 마디에 곧장 저항에서 순응으로 전환해, 실제 치료 진전이 없어도 높은 점수를 받는 ‘점수 인플레이션’ 현상이 나타난다고 지적했다.

이 문제를 해결하기 위해 연구진은 인지행동치료(CBT)에 근거한 저항 인식 프레임워크를 제안했다. 핵심은 인지 개념화 다이어그램(CCD)을 활용해 내담자의 저항을 동적으로 모델링하는 시뮬레이터 ‘CARS’다. CARS는 상담 흐름에 따라 내담자의 심리 상태와 저항 수준이 현실적으로 변화하도록 설계됐다. 여기에 더해 연구진은 전략적 추론 모듈(Thinker)과 응답 생성 모듈(Presenter)을 분리한 이중 구조 프레임워크 ‘STREAMS’를 개발하고 강화학습으로 최적화했다.

a woman sitting on a couch talking to a man — 사진: Vitaly Gariev / Unsplash

평가 지표도 새롭게 제안됐다. 연구진이 내놓은 ‘EWTS-MI’는 엔트로피 가중치를 적용해 저항이 강한 상황에서의 반응성을 측정하는 지표다. 실험은 저항이 있는 환경과 그렇지 않은 환경 양쪽에서 진행됐으며, 저항 인식 훈련이 까다로운 상담 상황에서의 전략적 견고성을 높인다는 결과를 얻었다. 이 연구는 AI 심리상담 시스템이 실제 임상 현장의 복잡성을 얼마나 충실하게 반영하는지를 재점검해야 한다는 문제의식에서 출발했다는 점에서 의미가 있다.

심리 상담 AI 분야는 LLM의 공감 능력과 대화 능력이 향상되면서 빠르게 성장하고 있으나, 실제 치료 효과와 평가 환경 간의 간극은 좁혀지지 않았다는 비판이 꾸준히 제기돼 왔다. 이번 연구는 내담자 저항이라는 임상 현실을 시뮬레이션에 통합함으로써, 보다 실질적인 AI 상담 평가 기준을 마련하려는 시도로 평가된다.