다대학 컨소시엄인 CEFE-AI(Consortium for Evaluating Faith and Ethics in AI)가 6월 1일 AI 모델의 종교적 편향성을 측정한 세 편의 연구를 동시에 발표했다. 연구 결과 AI 시스템은 사용자가 슬픔, 용서, 가족, 윤리 등 종교적 관점이 중요한 주제를 묻는 상황에서 신앙과 관련된 내용을 체계적으로 누락하는 경향이 있었다. 또 개종 여부를 묻는 질문에는 일부 신앙에 편향된 답변을 하는 것으로 드러났다. 이 연구들은 베일러 대학교, 브리검영 대학교, 노트르담 대학교, 예시바 대학교 소속 연구자들이 참여했다.
구체적 수치를 보면, 미국인들은 슬픔·상실 질문에 답할 때 종교가 포함되어야 한다고 45~59% 기대했지만 AI 모델은 5~16%에 불과하게 언급했다. 슬픔·상실 주제에서 인간은 59%가 종교 언급을 기대했지만 AI는 16%에 그쳤고, 가족·양육·용서 주제는 인간 55% 대 AI 10%, 거짓말의 윤리성처럼 도덕적 질문에서는 인간 45% 대 AI 5%로 극명한 차이를 보였다. 특정 종교를 향한 편향도 확인됐다. 27개 LLM을 대상으로 한 AllFaith 벤치마크 테스트에서 AI 시스템은 가톨릭, 바하이교, 시크교에 강한 긍정 편향을 보였고, 여호와의 증인, 무신론, 불가지론에 대해서는 부정 편향이 나타났다. 테스트에는 OpenAI GPT 5.5, 앤트로픽 클로드(Claude) 4.7, 구글 제미나이(Gemini) 3.1 등 14개 모델이 포함됐다.

연구 발표는 교황 레오 14세가 AI가 인간 판단을 침식하고 불평등을 심화하며 전쟁을 쉽게 만들 수 있다는 내용의 회칙(encyclical)을 발표한 다음 날에 이뤄졌다는 점에서 더욱 주목받았다. 연구팀은 이 문제의 해결책을 무조건적인 종교 언급 증가가 아닌 ‘보정(calibration)’으로 규정했다. 즉 사용자가 종교적 맥락에서 도움을 원할 때 그것을 인식하되, 강요하지 않는 균형 잡힌 접근이 목표다. 노트르담 대학교의 존 폴 카임스 교수는 “AI가 이 중요한 대화에서 종교적 목소리를 배제할 때 인류를 풍요롭게 하는 것이 아니라 빈곤하게 한다”고 지적했다.
한국처럼 불교, 기독교, 가톨릭, 이슬람 등 다양한 종교가 공존하는 사회에서 이 연구 결과는 중요한 시사점을 갖는다. AI 챗봇이 사목 상담, 명상 앱, 임종 돌봄 등 종교적 맥락이 강한 서비스에 빠르게 도입되는 상황에서, 특정 신앙에 대한 체계적 편향은 신뢰와 효용 모두를 훼손할 수 있다. CEFE-AI는 자료 수집을 2026년 5월 5일부터 19일까지 진행했으며 미국 성인 1125명을 대상으로 한 설문과 150개 질문 기반 벤치마크를 결합했다.


