개발 도구 전문 기업 젯브레인스(JetBrains)가 소프트웨어 엔지니어링 작업에 특화된 오픈 혼합 전문가(MoE, Mixture-of-Experts) 모델 멜룸2(Mellum2)를 허깅페이스(Hugging Face)에 공개했다. 멜룸2는 총 120억 개의 파라미터를 보유하지만 토큰당 25억 개만 활성화하는 MoE 구조를 채택해, 동급 규모 모델 대비 2배 이상 빠른 추론 속도를 실현한다. 라이선스는 Apache 2.0으로 상업적 활용이 가능하며, 텍스트와 코드 처리에 집중해 멀티모달 기능은 제외하는 대신 경량성과 배포 효율을 높였다.
멜룸2의 주요 활용 시나리오는 멀티 모델 시스템의 라우터 및 오케스트레이터, 검색증강생성(RAG) 파이프라인의 맥락 압축 및 요약, AI 에이전트의 하위 작업 수행, 자체 인프라 내 온프레미스 배포 등이다. 젯브레인스는 최신 대형 모델 하나가 모든 역할을 담당하는 모놀리식 접근보다, 경량 전문 모델들이 병렬로 협력하는 구조가 프로덕션 AI 시스템에서 더 현실적이라고 설명했다. 기술 보고서에 따르면 멜룸2는 코드 생성, 추론, 과학, 수학 벤치마크에서 유사 규모 오픈 모델 대비 경쟁력 있는 점수를 기록했다.
멜룸2는 멜룸(Mellum) 시리즈의 후속 모델로, 초기 멜룸이 코드 자동완성 전용이었다면 멜룸2는 자연어와 소프트웨어 엔지니어링 작업 전반으로 범위를 확장했다. 모델 가중치와 기술 보고서(arXiv)는 허깅페이스와 깃허브에서 내려받을 수 있다. 국내 IDE 기반 개발 환경이나 사내 코드 보안 정책으로 외부 API 연결이 어려운 기업이라면, 멜룸2를 자체 서버에 배포해 코딩 보조, 코드 리뷰 자동화 등 개발자 생산성 향상에 활용할 수 있다.


