막대한 비용이 드는 대규모 AI 서버 단지를 짓기 전에, 그 시스템이 얼마나 빠르고 얼마나 적은 전력으로 돌아갈지 컴퓨터 안에서 미리 따져보는 길이 열렸다. 한국과학기술원(KAIST) 전산학부 박종세 교수 연구팀이 29일 공개한 가상 검증 플랫폼이 그 역할을 맡는다. 이 성과는 IEEE(국제전기전자공학자협회)가 여는 국제학회 ‘ISPASS 2026′(International Symposium on Performance Analysis of Systems and Software)에서 최우수 논문상으로 인정받았다.
연구팀이 ‘LLMServingSim 2.0’으로 명명한 이 플랫폼은 복잡한 AI 서비스 운영 환경에서 다양한 하드웨어와 소프트웨어 조합을 가상으로 분석하는 시뮬레이터다. 기존 그래픽처리장치(GPU) 중심 환경은 물론, 차세대 AI 반도체인 신경망처리장치(NPU·Neural Processing Unit)와 프로세싱 인 메모리(PIM·Processing-In-Memory) 환경까지 폭넓게 지원한다. 어떤 반도체를 끼웠을 때 응답이 얼마나 빨라지고 전력 부담이 어디까지 떨어지는지, 또 서버를 수만 대로 늘려도 흔들림 없이 버티는지를 실물 한 대 없이 그대로 재현해 따져볼 수 있다. 연구팀은 오픈소스로 코드를 공개(llmservingsim.ai)해 거대언어모델(LLM·Large Language Model) 서비스 기업과 AI 반도체 스타트업이 실용화에 활용할 수 있도록 했다.

박종세 교수는 “AI 서비스 경쟁력은 모델 자체뿐 아니라 이를 안정적이고 효율적으로 운영하는 인프라 기술에서 결정된다”며 “연구자와 산업계가 차세대 AI 인프라를 더 빠르고 효율적으로 개발하는 데 중요한 기반이 되길 기대한다”고 말했다. 이번 연구는 전산학부 조재홍·최현민 석사과정 학생이 공동 1저자로 참여했으며, 과학기술정보통신부, 정보통신기획평가원, 한국전자통신연구원(ETRI), SK하이닉스의 지원을 받아 수행됐다.
AI 인프라 투자 경쟁이 전 세계로 번지는 흐름에서 이 플랫폼이 갖는 의미는 분명하다. 막대한 비용이 드는 실물 장비를 미리 사들이지 않아도, 설계안 여러 개를 컴퓨터 안에서 돌려보며 어느 쪽이 나은지 가려낼 수 있기 때문이다. 아직 시장에 나오지 않은 미래형 AI 반도체조차 가상 데이터센터에 얹어 미리 돌려볼 수 있다는 점도 강점이다. 거대언어모델 서비스를 운영하는 기업이나 AI 반도체 스타트업이 본격 양산 이전 단계에서 검증 도구로 쓸 만한 대목이다.


