• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

NVIDIA CUDA 13.3, 타일 프로그래밍·CompileIQ 자동 튜닝으로 GPU 개발 혁신

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 01일 16시 15분
Home 반도체·인프라
Share on FacebookShare on Twitter

NVIDIA가 GPU 개발 툴킷 CUDA 13.3을 공개했다. 이번 업데이트의 핵심은 세 가지다. C++ 기반 타일 프로그래밍 지원 확대, CompileIQ 컴파일러 자동 튜닝 프레임워크 출시, CUDA Python 1.0 정식 버전 공개다. CUDA 타일 프로그래밍은 기존 Hopper 아키텍처(컴퓨트 캐퍼빌리티 9.0) GPU 외에 지원 범위를 확대했으며, 개발자가 타일 단위로 커널을 작성하면 병렬화·메모리 이동·비동기 처리 같은 저수준 GPU 세부 사항을 런타임이 자동으로 관리한다.

CompileIQ는 주요 커널의 실행 속도를 최대 15% 끌어올리는 컴파일러 자동 튜닝 프레임워크다. GEMM(범용 행렬 곱셈)과 어텐션(attention) 같은 AI 연산에서의 성능 개선이 주목적이며, 사전에 커널 변형을 벤치마킹해 최적의 실행 계획을 선택한다. 이번 릴리스에는 NVCC의 C++23 공식 지원, CCCL 3.3에서의 DLPack·mdspan을 통한 텐서 상호운용성 확장, cuBLAS·cuSPARSE·cuSOLVER 등 수학 라이브러리 업데이트, Nsight Compute 및 Nsight Systems 프로파일링 툴 개선도 포함됐다.

Close-up of two NVIDIA RTX 2080 graphics cards with dual fans, high-performance hardware.
사진: Nana Dua / Pexels

CUDA Python 1.0은 CUDA 생태계를 파이썬 언어로 노출하는 라이브러리 집합의 첫 정식 버전이다. 시맨틱 버저닝을 도입해 메이저 버전에서만 하위 호환성을 깨는 변경을 허용하기로 했으며, 마이너 버전은 기능 추가, 패치 버전은 버그 수정으로 운영한다. 포함 컴포넌트는 CUDA C API를 파이썬으로 노출하는 cuda.binding, 런타임과 핵심 기능에 접근하는 cuda.core, CCCL 병렬 알고리즘을 파이썬에서 쓸 수 있게 하는 cccl-cuda, CUDA 컴포넌트 위치를 탐색하는 cuda-pathfinder다. 특히 cuda.core 1.0은 그린 컨텍스트(GPU SM을 독립 파티션으로 분할해 지연 민감 커널 격리), 프로세스 체크포인팅(CUDA 상태 스냅샷 저장 및 복원, Linux 전용), IPC(프로세스 간 GPU 메모리 공유, 복사 없음) 기능을 새로 지원한다.

이번 업데이트는 AI 모델 학습과 추론에 직결되는 핵심 연산의 속도와 개발 생산성을 동시에 겨냥한다. CompileIQ의 최대 15% 성능 향상은 대규모 모델 서빙 환경에서 상당한 비용 절감 효과로 이어질 수 있으며, CUDA Python 1.0의 안정 버전 출시는 파이썬 기반 AI 연구자들이 GPU를 더 직접적으로 제어할 수 있는 기반을 제공한다. 타일 프로그래밍의 C++ 지원 확장 또한 기존 대규모 C++ 코드베이스를 보유한 기업들의 GPU 전환 장벽을 낮출 것으로 전망된다.

Tags: CompileIQCUDAGPUNVIDIAPython개발자도구
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
A minimalistic workspace featuring a laptop, coffee cup, and books on a white de

엔비디아 칩 탑재 첫 Windows PC, 마이크로소프트 Surface·델서 출시

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI과학 AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic AWS ChatGPT Claude Co-Scientist IBM IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 기업공개 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 생산성 생성형AI 스페이스X 아마존 앤트로픽 에이전트 엔비디아 엔터프라이즈 오픈AI 오픈소스 중국 클라우드 클로드 허깅페이스

최근 뉴스

AI 멀티모달 모델 추상 흑백 다이어그램 — 멀티-LoRA 학습 아키텍처

Trajectory, 멀티-LoRA 연속학습 스택 SkyRL 오픈소스 공개… 실험 처리량 2.81배

2026년 06월 01일 19시 24분
파란색 음파 파형 — AI 음성 인식 처리

Together AI, 세계 최고속 STT 스택 공개… 20시간 음성을 10초 이내 처리

2026년 06월 01일 18시 48분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.