오픈AI, 프런티어 AI 거버넌스 프레임워크 공개

오픈AI(OpenAI)가 프런티어(Frontier) AI, 즉 최첨단 대형 AI 모델의 개발과 배포에 적용할 거버넌스 프레임워크를 공식 공개했다. 이 문서는 고도화된 AI 시스템이 사회에 미치는 영향이 커지는 상황에서, 오픈AI 스스로 어떤 원칙과 절차에 따라 모델 출시와 운용을 결정하는지를 대외에 천명한 정책 문서다. 안전 평가, 외부 감사, 정부 및 국제기구와의 협력을 포함한 복수의 축으로 구성된 것으로 알려졌다.

프레임워크의 핵심은 모델이 사전 정의된 위험 임계값을 넘을 경우 출시를 제한하거나 조건부로 허용하는 ‘준비 기준'(readiness threshold) 체계다. 오픈AI는 이미 2023년부터 내부 준비 체계를 운영해왔으나, 이번에는 그 기준과 절차를 외부에 공개 가능한 형태로 정리해 투명성을 높였다. 사이버 보안 취약점 악용, 생물학적 위협 지원, 대규모 허위 정보 생성 등 고위험 능력에 대한 평가 기준이 포함된 것으로 전해진다. 아울러 제3자 기관이 해당 기준에 따라 독립적으로 모델을 평가할 수 있는 경로도 제시한다.

Close-up of a hand signing insurance documents in an office setting. — 사진: Kampus Production / Pexels

이 발표는 오픈AI가 최근 강화하고 있는 거버넌스 정책화 흐름의 일환이다. 오픈AI는 올해 들어 안전·보안 위원회를 이사회 산하 상설 기구로 격상하고, 프런티어 모델 평가에 외부 연구기관을 참여시키는 방안을 확대해왔다. 프레임워크 공개는 미국과 유럽연합(EU) 각국이 AI 규제 입법을 구체화하는 시점에 이뤄져, 오픈AI가 자율 규제 선도 사례를 제시함으로써 규제 논의에서 주도권을 유지하려는 전략적 행보로 해석된다. EU AI법이 고위험 AI 시스템에 요구하는 사전 적합성 평가와 방향이 겹치는 부분이 많다는 점도 주목된다.

AI 안전 분야 전문가들은 이번 프레임워크가 기업 주도 자율 규제의 진전이라는 점에서 의미가 있다고 평가하면서도, 집행력이 기업 내부에 머무른다는 한계를 지적한다. 오픈AI는 프레임워크 이행 현황을 정기적으로 보고하는 방안을 검토하고 있으며, 국제 AI 안전 연구소 네트워크를 통한 다자 검증 체계와의 연동도 과제로 남아 있다.