• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

NVIDIA·마이크로소프트, Windows PC용 개인 AI 에이전트 개발 도구 공개

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 04일 15시 29분
Reading Time: 1 min read
A A
Home 반도체·인프라
Share on FacebookShare on Twitter

NVIDIA와 마이크로소프트가 2026년 6월 2일 Build 2026에서 Windows PC 환경의 개인 AI 에이전트 개발을 위한 새로운 도구 묶음을 공개했다. 핵심은 에이전트 샌드박싱 보안 체계와 추론 성능 향상, 그리고 멀티 GPU 지원이다.

보안 측면에서 마이크로소프트는 Microsoft eXecution Containers(MXC)를 발표했다. 이는 에이전트가 파일, 네트워크, 시스템 자원에 접근하는 범위를 정책으로 정의하고 윈도우 네이티브 운영체제 구조를 이용해 격리하는 계층이다. NVIDIA는 이 MXC를 기반으로 구축한 OpenShell 런타임을 Windows에 가져온다고 밝혔다. OpenShell은 에이전트 정책 관리, 추론 라우팅, 개인정보 식별 정보(PII) 난독화 기능을 제공하며, 오픈소스 에이전트인 OpenClaw와 Hermes Agent에 통합될 예정이다. 추론 성능 면에서는 llama.cpp가 Qwen 3.5 및 3.6 27B 밀집 모델에서 2배, 35B MoE(전문가 혼합) 모델에서 1.6배 성능 향상을 달성했다고 NVIDIA가 밝혔다. 이는 멀티 토큰 예측(MTP)과 프로그래밍 방식의 종속 실행(PDL) 기술이 결합된 결과다. vLLM은 BF16 커널 최적화와 CUDA 그래프 개선을 통해 DGX Spark 기준 2.6배 성능 향상을 이뤘다.

Top view of NVIDIA GTX 1080 and RTX 2080 graphics cards used in advanced computer setups.
사진: Nana Dua / Pexels

멀티 GPU 지원도 강화됐다. llama.cpp는 텐서 병렬성(TP)을 도입해 두 개의 동등한 GPU를 동시에 활용할 수 있으며, 메모리 용량이 약 2배, 연산 성능이 약 1.8배까지 확장된다. ComfyUI는 분류기 자유 유도(CFG) 방식을 적용해 두 GPU에서 최대 2배 연산 효율을 달성할 수 있게 됐다. 하드웨어 측면에서는 1페타플롭(petaflop) AI 성능과 최대 128GB 메모리를 갖춘 NVIDIA RTX Spark 소형 데스크톱 및 노트북 제품군이 공개됐으며, 마이크로소프트 서피스 NVIDIA RTX Spark 데브 박스(Dev Box)는 이를 탑재한 개발자 전용 기기다.

H 컴퍼니(H Company)는 새 Holo 3.1 모델 시리즈도 발표했다. 이 모델들은 화면을 보고 클릭 등 동작을 취하는 Computer Use 모드에 최적화됐으며, FP8 대비 메모리를 35% 절감한 양자화 체크포인트를 포함한다. NVIDIA는 H 컴퍼니와 협력해 이 모델과 실행 환경의 NVIDIA GPU 성능을 2배 이상 끌어올렸다고 밝혔다. 이번 발표는 세계 1억 개 이상의 NVIDIA RTX PC를 에이전트 개발의 기반으로 삼으려는 양사의 전략적 방향을 명확히 보여준다.

Tags: llama.cppMicrosoftMXCNVIDIAOpenShellRTX Spark
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

젠슨 황 엔비디아 CEO
반도체·인프라

젠슨 황, 방한 중 엔씨·크래프톤 회동… AI 노트북·피지컬 AI 협력 논의

2026년 06월 05일 17시 14분
젠슨 황 엔비디아 CEO
반도체·인프라

젠슨 황, 방한해 SK·현대차·LG·네이버 총수와 AI 협력 회동

2026년 06월 05일 16시 29분
System with various wires managing access to centralized resource of server in data center
반도체·인프라

KT클라우드, 공공 전용 클라우드에 리벨리온 NPU 서버 상품 출시

2026년 06월 05일 16시 17분
Gloved hand holding three empty laboratory flasks in a scientific setting.
반도체·인프라

한미반도체, 컴퓨텍스 첫 참가…HBM4용 TC 본더 4 공개

2026년 06월 05일 16시 07분
Next Post
A woman browses an online shopping site on a tablet. Perfect for ecommerce and technology themes.

시간 흐름 반영한 확산 모델 추천 시스템 TDPM 제안

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
Detailed view of a computer processor, showcasing its pins, against a clean white backdrop.

폭스콘·인텔, AI 인프라 공동개발 동맹…엔비디아 대안 구축 가속

2026년 06월 05일 17시 18분
젠슨 황 엔비디아 CEO

젠슨 황, 방한 중 엔씨·크래프톤 회동… AI 노트북·피지컬 AI 협력 논의

2026년 06월 05일 17시 14분
Close-up of a digital interface showcasing futuristic graphs and data analytics in low light.

6.3 지선 출구조사 대거 빗나가…AI 예측 고도화 논의 불붙어

2026년 06월 05일 17시 10분
Conceptual portrait with laser scanning for facial recognition on plain black background.

메타 AI 앱에서 스마트 글라스용 안면인식 코드 ‘NameTag’ 발견

2026년 06월 05일 17시 06분
Metallic AA batteries stacked in a pyramid shape, symbolizing power and energy storage.

웨이모, 퇴역 로보택시 배터리를 전력망 저장 장치로 재활용

2026년 06월 05일 17시 01분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

카테고리

  • AI 모델·연구 (278)
  • AI 서비스·툴 (122)
  • 반도체·인프라 (131)
  • 빅테크·기업 (121)
  • 산업 적용 (101)
  • 스타트업·투자 (69)
  • 정책·윤리 (116)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

최근 뉴스

Detailed view of a computer processor, showcasing its pins, against a clean white backdrop.

폭스콘·인텔, AI 인프라 공동개발 동맹…엔비디아 대안 구축 가속

2026년 06월 05일 17시 18분
젠슨 황 엔비디아 CEO

젠슨 황, 방한 중 엔씨·크래프톤 회동… AI 노트북·피지컬 AI 협력 논의

2026년 06월 05일 17시 14분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.