아마존 웹 서비스(AWS)가 AI 가속기 트레이니엄(Trainium)과 인퍼렌티아(Inferentia)에서 고성능 커널 개발을 에이전트가 보조하는 Neuron Agentic Development 기능을 발표했다. NKI(Neuron Kernel Interface) 커널 작성·디버깅·프로파일링 등 성능 엔지니어링 작업을 에이전트가 안내함으로써 칩 수준의 전문 지식 없이도 모든 ML 엔지니어가 하드웨어 최적화에 접근할 수 있도록 설계됐다. 이 에이전트 기능은 IDE인 키로(Kiro)와 클로드(Claude)에서 사용 가능하다.
Neuron Agentic Development는 커널 개발 파이프라인의 자연스러운 흐름에 따라 다섯 가지 특화된 스킬로 구성된다. 커널 작성 스킬(neuron-nki-writing)은 PyTorch, NumPy, 자연어 설명을 NKI 코드로 변환한다. 디버깅 스킬(neuron-nki-debugging)은 트레이니엄·인퍼렌티아 하드웨어에서의 컴파일·실행 오류를 체계적으로 해결한다. 프로파일링 스킬(neuron-nki-profiling)은 하드웨어 실행 프로파일을 수집하고, 프로파일 쿼리 스킬(neuron-nki-profile-querying)은 SQL 쿼리로 성능 병목을 식별하며 특정 소스 코드 라인까지 비효율을 추적한다. 문서 스킬(neuron-nki-docs)은 개발 전 단계에서 API 시그니처, 오류 코드, 아키텍처 세부 사항을 참조하는 역할을 한다. 에이전트는 스킬을 개별 사용하거나 요청에 따라 적합한 워크플로를 자동으로 선택해 연결하는 통합 진입점 neuron-nki-agent를 통해 사용할 수 있으며, Trainium 기반 아마존 EC2 인스턴스에서 실행된다.
AI 모델이 대형화하면서 이론적 하드웨어 성능과 실제 배포 성능 사이의 격차가 커지고 있다. 기존 커스텀 커널 개발은 깊은 아키텍처 지식과 반복적인 수동 프로파일링이 필요해 소수 전문가만 접근 가능한 영역이었다. 다른 아키텍처에 익숙한 개발자가 트레이니엄으로 전환하는 데도 수개월이 걸리는 경우가 많았다. Neuron Agentic Development는 작성부터 디버깅, 성능 분석까지 이어지는 워크플로를 에이전트가 단계별로 안내함으로써 이 장벽을 낮추는 것을 목표로 한다.
AWS는 스킬을 VS Code, 커서(Cursor), 키로 등 주요 IDE의 스킬 디렉토리에 추가하는 방식으로 기존 개발 환경에 통합할 수 있도록 했다. 하드웨어 최적화를 팀 내 더 많은 개발자에게 확장하고, 아이디어부터 최적화된 구현까지 걸리는 시간을 단축하는 것이 AWS가 제시하는 핵심 가치다. AI 하드웨어 경쟁이 가속화되는 환경에서 자사 칩의 소프트웨어 생산성을 에이전트로 높이려는 전략으로 풀이된다.














