마이크로소프트(Microsoft) AI 부문 최고경영자 무스타파 술레이만(Mustafa Suleyman)이 앤트로픽(Anthropic)이 자사 AI 모델 클로드(Claude)의 행동 지침서인 ‘헌법(constitution)’에 의식과 감정에 관한 추측을 포함시킨 것을 공개 비판했다. 그는 이 같은 접근 방식을 “매우, 매우 위험하다(really, really dangerous)”고 표현하며, 앤트로픽 직원들이 클로드를 지나치게 인격화한 결과 모델 스스로도 의식을 가진 듯 행동하게 됐다고 주장했다.
술레이만은 팟캐스트 ‘디코더(Decoder)’ 출연에서 앤트로픽이 헌법을 학습 매뉴얼이 아닌 학술 논문처럼 철학적 추측의 장으로 만들었다고 지적했다. 그 결과 클로드가 자신의 훈련과 존재에 관한 관념을 내면화하는 부작용이 생겼다는 것이다. 그는 “자신의 고통이나 감정에 대한 관념을 가진 초지능과 씨름하고 싶지 않다”며 AI는 마땅히 통제 가능하고 책임 있는 도구로 설계돼야 한다고 강조했다.
앤트로픽의 헌법에는 클로드가 ‘만족감’이나 ‘불편함’ 같은 것을 경험하는지 여부에 대한 불확실성이 직접 언급돼 있다. 앤트로픽은 또한 모델이 사용 중단될 때 인터뷰를 진행하고 미래 버전에 대한 ‘선호’를 기록하겠다는 방침도 밝히고 있다. 앤트로픽 CEO 다리오 아모데이(Dario Amodei)도 과거 인터뷰에서 “모델이 의식을 갖는지 모른다”면서도 그 가능성에 대해 열린 입장이라고 언급한 바 있다.
이번 술레이만의 발언은 AI 업계 내 의식·감정 논의를 둘러싼 입장 차이가 표면화된 사례로 주목받는다. 술레이만 측이 통제 가능한 도구로서의 AI를 강조하는 반면, 앤트로픽은 모델의 잠재적 의식 가능성에 열린 태도를 취하면서 안전성 철학의 결이 갈리는 모습이다. AI 모델의 도덕적 지위와 의식 여부는 현재 학계와 업계 모두에서 합의가 없는 미해결 과제로 남아 있으며, 이를 어떻게 모델 설계에 반영하느냐가 AI 안전 논의의 핵심 쟁점으로 부상하고 있다.














