애플, WWDC26에서 Core AI 공개…애플 실리콘 전용 온디바이스 생성 AI 프레임워크

애플(Apple)이 WWDC26에서 Core AI 프레임워크를 공개했다. Core ML의 공식 후속으로 개발자들이 대규모 언어 모델(LLM)과 생성 AI를 완전히 기기 내에서 실행할 수 있도록 지원한다. 맞춤 변환된 파이토치(PyTorch) 모델과 사전 최적화된 오픈소스 모델을 모두 지원하며, 애플 실리콘이 탑재된 기기에서만 작동한다. Core ML이 전통적인 머신러닝 모델 추론에 초점을 맞췄던 것과 달리, Core AI는 처음부터 트랜스포머 기반 생성 AI를 염두에 두고 설계됐다.

Core AI는 3B 파라미터 규모의 비전 모델부터 70B 파라미터 규모의 추론 모델까지 아우르는 통합 아키텍처를 제공한다. 지원 기기는 아이폰, 아이패드, 맥, 애플 비전 프로다. CPU·GPU·뉴럴 엔진을 단일 API 아래 통합 활용하는 ‘통합 하드웨어 접근’, 제로 카피(zero-copy) 데이터 경로를 지원하는 메모리 안전 스위프트(Swift) API, 사전 컴파일(AOT) 방식이 핵심 기능이다. 사전 컴파일 덕분에 모델이 캐시에 올라간 이후 로딩 시간이 거의 없는 수준으로 줄어든다. 파이토치 모델 변환은 ‘TorchConverter’로 이뤄지며, 양자화(quantization)와 팔레타이제이션(palettization)으로 디스크 크기·추론 지연·전력 소비를 함께 줄일 수 있다.

출처: Disk Depot Ltd. / Wikimedia Commons / CC BY-SA 4.0

Core AI 등장으로 애플의 ML 실행 환경은 세 갈래로 정리됐다. Core ML은 의사결정 트리·표 형식 피처 엔지니어링 같은 고전적 비신경망 ML에, Core AI는 신경망과 트랜스포머 계열을 담당하며, MLX Swift는 맞춤 모델 가중치 작업에 활용된다. Core AI는 Apple Intelligence의 기반 기술이며, 애플은 다음 OS 및 툴체인 릴리스에서 이를 개발자에게 공개해 ‘맞춤 인텔리전스’ 구현을 가능하게 할 방침이다.

이번 발표가 주목받는 이유는 온디바이스 AI의 경제성과 프라이버시를 동시에 겨냥했기 때문이다. 서버 의존 없이 기기에서 추론을 완결하면 토큰당 클라우드 비용이 발생하지 않고, 사용자 데이터는 기기 밖으로 나가지 않는다. 경쟁 구도를 보면 퀄컴의 AI 허브, 구글의 온디바이스 Gemini Nano 등이 비슷한 영역을 공략하고 있으나, 하드웨어·소프트웨어·개발 도구를 수직 통합한 애플의 생태계는 타 플랫폼 대비 최적화 여지가 크다. 다만 Core AI는 애플 실리콘 전용이므로, 국내 사용자 기반이 iOS와 안드로이드에 분산된 현실에서 크로스플랫폼 서비스를 운영하는 개발팀은 별도 추론 경로를 유지해야 한다는 점에서 운영 복잡성이 높아진다. 오픈소스 모델 커뮤니티가 Core AI 포맷을 얼마나 빠르게 지원하느냐가 실질적인 확산 속도를 결정할 것으로 보인다.