모델 네이티브 컴퓨팅 아키텍처: LLM 시대의 새 시스템 설계 원칙

LLM(대규모 언어 모델)이 단순 모델 기술을 넘어 시스템 기술로 전환하고 있다는 주장이 담긴 개념 논문이 arXiv에 공개됐다. “Model-Native Computing Architecture: Envisioning Future System Architecture Through the Lens of Computer Architecture”(2606.00288)는 코덱스(Codex), 클로드 코드(Claude Code), 오토GPT(AutoGPT) 같은 AI 에이전트가 코드 작성, 프로젝트 관리, 다단계 작업 실행에 폭넓게 활용되면서, 캐시 재사용, 컨텍스트 관리, 에이전트 스케줄링, 권한 제어 같은 반복적 공학 문제들이 고전 컴퓨터 시스템 문제와 닮아있음을 지적한다.

논문은 이 유사성을 비전 서베이(visionary survey) 형식으로 체계화하고, 분산 LLM 기반 스택의 다양한 연구 흐름이 동일한 시스템의 서로 다른 계층을 다루고 있으나 통합된 모델이 없다는 공백을 짚는다. 이를 메우기 위해 저자는 ICAM(Intelligent Computing Architecture Model)이라는 6계층 모델 네이티브 컴퓨팅 프레임워크를 제안한다. 핵심 개념은 이중 평면 관점으로, LLM을 CPU에 가까운 존재로 볼 것인가 운영체제로 볼 것인가 하는 오랜 논쟁을 확률적 실행 평면(무엇을 계산할 수 있는가)과 결정론적 제어 평면(무엇을 계산해야 하는가)으로 분리해 해소한다. 아울러 KV 캐시 재사용 원칙인 ‘의미 지역성 법칙(Semantic Locality Law)’, 유한한 컨텍스트 창에서의 작업 집합을 규정하는 ‘컨텍스트 예산 법칙(Context Budget Law)’, 다중 에이전트 협업의 수익 체감을 설명하는 ‘에이전트 가속 법칙(Agent Speedup Law)’ 세 가지 설계 법칙도 도출해 공개된 시스템 수준 데이터와 대조 검증했다.

Detailed view of electronic components on a computer motherboard focusing on connectors and capacitors. — 사진: Djenz Van Eysendeyk / Pexels

이 연구는 새로운 실험 결과를 보고하지 않는 개념·서베이 기여 논문임을 명시하고 있다. 그럼에도 에이전트 소프트웨어 개발 관행이 빠르게 확산되는 현시점에서, 단편적으로 연구되어온 LLM 운영체제, 메모리 관리, 에이전트 프레임워크, 도구 프로토콜, 다중 에이전트 조율, 안전 거버넌스 등의 흐름을 하나의 일관된 시스템 모델로 통합하려는 시도라는 점에서 학계와 산업계 모두에 참조점이 될 전망이다. 논문은 컴퓨터 아키텍처 유추가 한계를 드러내는 지점도 명시적으로 밝히며 모델 네이티브 컴퓨팅을 위한 연구 로드맵을 제시한다.