• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

안전장치 해제된 AI 모델 1300만 건 다운로드… “오픈소스 무방비 노출”

STORIUM 편집부 작성: STORIUM 편집부
2026년 05월 30일 17시 46분
Home 정책·윤리
Share on FacebookShare on Twitter

메타와 구글 등 주요 빅테크 기업이 공개한 오픈소스 인공지능(AI) 모델의 안전장치를 손쉽게 제거할 수 있는 도구들이 온라인에서 빠르게 퍼져 나가며, 생물무기·악성코드 관련 답변까지 생성하는 변형 AI 모델이 대량 유통되고 있는 것으로 나타났다. 한 AI 안전성 단체의 테스트에 따르면, 안전장치가 제거된 구글의 오픈소스 모델은 유해 가스 살포 방법이나 신용카드 정보를 탈취하는 악성코드 작성법 등을 생성했다.

한 매체는 깃허브에서 공개된 도구를 사용해 메타의 오픈소스 모델의 안전장치를 10분도 안 되는 시간 안에 제거하는 데 성공했다고 전했다. 별도의 고성능 장비나 전문 지식 없이도 가능했다는 설명이다. 안전장치가 제거된 모델은 원래 시스템이 거부하던 위험한 질문에도 응답했다. 한 대학 교수는 과거에는 안전장치를 제거하려면 전문성과 지속적 노력이 필요했지만, 이제는 일반 사용자도 쉽게 할 수 있는 수준이 됐다고 지적했다.

HC Verma solution app - MIT License proj
출처: Wikimedia Commons / MIT

문제는 최첨단 AI 모델의 능력이 빠르게 향상하면서 위험이 더 심각해지고 있다는 점이다. AI 기업들은 그동안 모델 오남용을 막기 위해 수백만 달러를 투입해 안전 가드레일을 구축해 왔다. 그러나 ‘소멸(abliteration)’로 알려진 기법은 이러한 안전장치를 빠르게 제거할 수 있으며, 특히 누구나 다운로드하고 수정할 수 있는 오픈소스 모델에서 위협이 커지고 있다는 지적이다.

오픈AI의 챗GPT나 앤트로픽의 클로드 같은 비공개 모델은 핵심 코드에 외부 접근이 불가능해 안전장치 제거가 쉽지 않다. 다만 오픈소스 AI는 최근 최첨단 폐쇄형 모델과의 성능 격차가 많이 줄어든 상태다. 한 도구 개발자는 자신의 도구를 통해 3500개 이상의 ‘검열 해제’ 모델이 제작됐고 다운로드 수는 1300만 건에 달한다며, 업계의 가드레일이 얼마나 취약한지 보여주기 위해 이를 공개했다고 밝혔다.

AI 업계도 대응책 마련에 고심하고 있다. 오픈AI는 위험한 데이터를 제거한 데이터셋으로 학습하는 방식을 도입했지만, 전문가들은 단순히 유해 데이터를 삭제하는 것만으로는 충분하지 않을 수 있다고 본다. 한 교수는 위험한 데이터를 제거하면 모델이 오히려 악의적 사용을 인지하지 못하는 ‘순진한’ 상태가 될 수도 있다고 지적했다. 오픈소스 AI의 개방성과 안전성을 어떻게 양립시킬지는 한국을 포함한 글로벌 AI 거버넌스의 핵심 과제로 떠오르고 있다.

Tags: AI 안전라마오픈소스 AI젬마탈옥
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
'AI 일자리 대란' 공포에 대한 현실 점검

'AI 일자리 대란' 공포에 대한 현실 점검

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI 검색 AI과학 AI규제 AI안전 AI 에이전트 AI에이전트 AI 인프라 AI 코딩 Anthropic AWS Claude Co-Scientist Gemini IPO LLM OpenAI SynthID 검색 구글 구글 딥마인드 기업공개 노동시장 데이터센터 딥시크 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 생산성 스노우플레이크 스타트업 투자 스페이스X 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 오픈소스 로봇 중국 챗GPT 클라우드 클로드 허깅페이스

최근 뉴스

유럽의회 스트라스부르 루이즈 바이스 건물 반원형 의회장 내부

EU AI법 옴니버스 합의: 기한 최대 16개월가량 연장, 딥페이크 신규 금지

2026년 05월 30일 21시 11분
그로크 LPU v1 칩 다이 사진

그로크, 기존 투자자 대상 6.5억 달러 추가 조달 추진

2026년 05월 31일 00시 20분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.