엔비디아가 컴퓨텍스 2026 기간 열린 GTC 타이베이에서 RTX Spark와 함께 개인 AI 에이전트 생태계를 대폭 확장하는 방안을 발표했다. 핵심은 윈도우 환경에서 보안을 유지하면서 로컬 에이전트를 실행할 수 있도록 마이크로소프트와 공동으로 개발한 새로운 보안 기반이다. OpenShell 런타임이 윈도우에 이식되며, 마이크로소프트의 새로운 윈도우 보안 기본 요소와 결합해 에이전트가 접근할 수 있는 범위와 데이터 전송 경로를 사용자가 직접 제어할 수 있게 된다.
RTX Spark는 1페타플롭의 AI 연산력과 128GB 통합 메모리를 갖춘 새로운 클래스의 윈도우 PC다. 에이전트가 윈도우 애플리케이션 내에서 작업을 수행하고, 앱 간 워크플로우를 처리하고, 이미지·영상·코드를 생성하고, 로컬 파일을 의미 기반으로 검색하는 데 필요한 컴퓨팅 성능을 온디바이스에서 제공하는 것이 목표다. 성능 측면에서도 주목할 만한 수치가 나왔다. llama.cpp와 협력해 멀티-토큰 예측(MTP)을 도입한 결과 Qwen 3.6·3.5 27B 모델에서 2배, 35B 모델에서 1.6배의 속도 개선이 이뤄졌다. 멀티 GPU 환경에서는 llama.cpp에 텐서 병렬 처리를 추가해 동급 GPU 두 장을 연결할 때 메모리 2배, 연산 1.8배 향상을 달성했다. ComfyUI도 두 장 GPU로 최대 2배 속도 향상을 누릴 수 있게 됐다.
창작 소프트웨어 분야에서도 협력이 이어진다. Adobe가 Premiere와 Photoshop을 RTX Spark 최적화 방식으로 재설계한다. Premiere는 RTX Spark의 통합 메모리, Blackwell GPU, TensorRT 소프트웨어를 활용하는 새로운 영상 파이프라인을 탑재해 편집·색보정·렌더링 성능을 높이고, Photoshop은 GPU 가속 합성 엔진과 AI 기반 파이프라인을 적용한다. Blender는 DLSS 4.5 Ray Reconstruction을 통합 데노이저로 채택한다. 이 업데이트들은 RTX Spark 출시 시점인 올 가을에 적용될 예정이다. 엔비디아 Broadcast 2.2는 스튜디오 음질 향상 기능 Studio Voice를 베타에서 정식 출시로 전환하고, Elgato Stream Deck 연동을 추가했다.
로컬 AI 에이전트 시장에서 엔비디아가 하드웨어(RTX Spark)부터 런타임(OpenShell)·소프트웨어 최적화(llama.cpp, vLLM)·창작 앱 파트너십까지 수직 통합을 완성하려는 의도가 뚜렷하다. 클라우드 API 비용과 데이터 프라이버시 우려가 높아질수록 온디바이스 에이전트의 수요는 늘어날 것으로 보이며, 이 시장을 선점하기 위한 에코시스템 구축 경쟁도 본격화될 전망이다.


