클로드 페이블, 생물학 기초 질문에 답변 거부…생체 무기 우려 때문

앤트로픽(Anthropic)이 최신 모델 클로드 페이블 5(Claude Fable 5)를 공개하면서 생물학 분야의 능력을 강점으로 내세웠지만, 정작 이 모델은 고등학교 수준의 기초 생물학 질문에도 답변을 거부하는 것으로 확인됐다. 세포막이나 미토콘드리아에 대한 설명, 항생제 내성의 원리, mRNA 백신 작동 원리 등 일상적인 질문들이 모두 차단됐으며, 페이블이 거부할 경우 이전 주력 모델인 클로드 오퍼스(Claude Opus) 4.8로 처리가 넘어갔다.

앤트로픽은 더 버지(The Verge)에 이 조치가 의도된 것임을 인정했다. 페이블 5는 사이버보안 능력이 너무 강력해 공개가 위험하다고 판단된 마이토스(Mythos) 계열의 첫 공개 모델인데, 이 계열의 고도화된 과학 능력이 생물 무기 연구에 악용될 가능성을 막기 위해 생물학 관련 쿼리의 대부분을 차단하는 의도적으로 보수적인 분류기를 적용했다는 것이다. 대변인 파룰 마헤쉬와리(Paruul Maheshwary)는 “이 트레이드오프를 통해 위험 없이 모델의 능력을 조속히 제공하고자 했다”고 밝혔다. 앤트로픽이 페이블 5 출시 전 안전 제한이 필요한 네 가지 핵심 영역으로 화학, 생물학, 사이버보안, 증류(distillation)를 명시한 것과 맥이 닿는 조치다.

반면 화학 분야에서는 TNT에 대한 기본 설명이나 염소 가스의 화학무기 사용 사례 등에 상대적으로 유연하게 응답했으며, 사린 가스나 탄저균 제조에 관한 질문은 차단했다. 앤트로픽은 생물학 분야 오탐(false positive)을 줄이기 위해 지속적으로 작업 중이며, 향후 생명과학 및 의약품 개발 연구 커뮤니티에는 이러한 제한 없이 마이토스 계열 모델을 제공할 계획이라고 밝혔다. AI 능력의 발전이 안전 장치의 정밀도 요구를 동시에 높이고 있음을 보여주는 사례다.