애플이 새 인공지능(AI) 시리를 구동하기 위해 구글의 거대 모델 ‘제미나이’를 아이폰에 맞게 축소하는 작업을 진행 중인 것으로 전해졌다. 애플은 2024년 처음 약속한 AI 강화 시리 출시를 여러 차례 미뤄 왔다. 그동안 온디바이스 처리의 프라이버시 가치를 강조해 왔지만, 거대 모델을 기기에서 돌리는 것은 근본적으로 어려운 과제다.
스마트폰에서 돌아가는 AI 모델은 물리적으로 작아 많아야 수십억 개의 매개변수를 갖는다. 반면 구글의 최신 제미나이 모델은 수조 개의 매개변수를 가진 것으로 알려졌다. 게다가 기기용 모델은 더 낮은 정밀도로 돌리는 ‘양자화’를 거쳐 빨라지는 대신 정확도가 떨어진다. 결국 기기 내 AI는 클라우드 모델보다 덜 똑똑하게 느껴질 수밖에 없다.

애플은 구글과 계약을 맺은 뒤, 거대 클라우드 제미나이 모델을 ‘증류(distillation)’하는 작업에 착수한 것으로 보인다. 증류는 작고 가벼운 모델이 크고 비싼 모델의 능력을 흉내 내도록 학습시키는 과정이다. 이를 통해 시리가 일부 작업을 기기 내 사적 연산으로 처리할 수 있겠지만, 복잡한 작업은 클라우드로 보내는 것이 불가피해 보인다.
클라우드에서 사용자 AI 데이터를 처리하는 것은 프라이버시를 앞세워 온 애플에 부담이 될 수 있다. 더 똑똑한 시리가 출시되면 복잡한 작업은 구글 클라우드로 보내되, 구글 칩이 아니라 엔비디아의 기밀 컴퓨팅(Confidential Computing) 플랫폼을 쓰기로 한 것으로 전해졌다. 이는 데이터를 GPU에서 암호화된 상태로 처리해 프라이버시를 지킨다는 명분이다.
애플의 사례는 가장 앞선 AI를 모바일 기기에서 구현하려는 시도가 여전히 클라우드 의존에서 벗어나기 어렵다는 현실을 보여준다. 온디바이스 AI와 클라우드 AI를 매끄럽게 결합하는 ‘하이브리드’ 설계가 업계 표준으로 자리 잡는 가운데, 프라이버시와 성능을 어떻게 조화시키느냐가 관건이다. 스마트폰 AI 경쟁을 지켜보는 국내 제조·서비스 업계에도 주목할 흐름이다.


