• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

젯브레인스, 소프트웨어 엔지니어링 특화 AI 모델 Mellum2 오픈소스 공개

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 04일 15시 29분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

개발 도구 기업 젯브레인스(JetBrains)가 소프트웨어 엔지니어링에 특화된 AI 모델 Mellum2를 아파치 2.0 라이선스로 오픈소스 공개했다. Mellum2는 전작인 완성 중심의 40억 파라미터 밀집형 모델을 계승하며, 코드 생성·편집, 디버깅, 다단계 추론, 도구 호출, 에이전트 코딩, 대화형 프로그래밍 지원 등 폭넓은 기능을 제공하는 범용 소프트웨어 엔지니어링 모델로 거듭났다.

Mellum2는 MoE(Mixture-of-Experts, 전문가 혼합) 아키텍처를 채택해 전체 파라미터는 120억 개이나 토큰당 실제 활성화되는 파라미터는 25억 개에 불과하다. 64개의 전문가 중 토큰마다 8개만 활성화하는 방식으로, 25억 파라미터 밀집형 모델 수준의 연산량을 유지하면서도 높은 전문성을 갖출 수 있다. 컨텍스트 길이는 최대 131,072 토큰이며 GQA(그룹 쿼리 어텐션)와 슬라이딩 윈도우 어텐션을 함께 적용했다. 사전학습은 다양한 웹 콘텐츠에서 코드·수학 데이터로 비중을 점진적으로 이동하는 3단계 커리큘럼을 통해 총 약 10.6조 토큰으로 진행됐다. 이후 베이스 모델의 컨텍스트 윈도우를 128K 토큰으로 확장한 뒤 지도 미세조정(SFT)과 검증 가능한 보상을 활용한 강화학습(RLVR)을 거쳤다. 젯브레인스는 사전학습 체크포인트부터 RL 튜닝 완료 모델까지 총 6개 체크포인트를 공개했다. Instruct 변형은 체인오브소트(Chain-of-Thought) 없이 즉각적인 응답을 제공해 낮은 지연 시간이 요구되는 작업에 적합하며, Thinking 변형은 복잡한 디버깅이나 다단계 계획 수립 시 명시적 추론 과정을 출력한다.

벤치마크 결과는 젯브레인스가 자체 공개한 수치로, 4B~14B 오픈웨이트 모델군을 비교 대상으로 삼았다. 코딩 평가에서 EvalPlus(HumanEval+와 MBPP+의 평균) 78.4점으로 Qwen3.5 4B(69.4점)·9B(71.8점)를 앞섰다. 도구 사용 벤치마크인 BFCL v3에서는 66.3점을 기록해 Qwen3.5 4B(64.1점)를 소폭 상회했다. 반면 지식 이해 지표인 MMLU-Redux에서는 78.1점으로 동급 모델 대비 낮은 편이며, LiveCodeBench v6에서도 Qwen3.5 9B에 비해 격차가 있어 범용 추론보다 코드·도구 특화 영역에서 강점이 두드러진다.

젯브레인스는 Mellum2를 독립형 프런티어 모델이 아닌 더 큰 AI 시스템 안에서 빠르고 효율적인 역할을 담당하는 ‘포컬 모델(focal model)’로 포지셔닝한다. 멀티모델 파이프라인의 라우팅·오케스트레이션, 낮은 지연 시간이 필요한 RAG(검색 증강 생성) 파이프라인, 복잡한 에이전트 워크플로우의 반복적 서브태스크 처리, 자체 인프라에서의 프라이빗 로컬 배포 등이 핵심 활용 시나리오로 제시됐다. 아파치 2.0 라이선스 적용으로 상업적 자체 호스팅이 제한 없이 허용된다는 점에서 기업 도입 시 코드·데이터의 외부 노출을 차단할 수 있다는 것이 주목된다.

Tags: JetBrainsMellum2MoE오픈소스코딩AI
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

two women sitting on a couch talking to each other
AI 모델·연구

저항하는 내담자 시뮬레이터로 AI 심리상담 평가 개선 연구

2026년 06월 05일 10시 52분
Detailed black and white photo of a circuit board showing intricate components, perfect for tech projects.
AI 모델·연구

와이즈넛, 멀티모달 AI 모델 ‘와이즈 로아 울트라’ 출시

2026년 06월 04일 23시 00분
Two professionals in business attire engage in a thoughtful discussion sitting in a stylish, modern room.
AI 모델·연구

LLM 에이전트, 정보 이득 보상으로 질문 전략 개선

2026년 06월 04일 19시 34분
Colorful abstract representation of a molecular structure with interconnected spheres.
AI 모델·연구

발화 전 내부 평가 분리하는 멀티 에이전트 시뮬레이션 TBS 제안

2026년 06월 04일 19시 17분
Next Post
Close-up of colorful CSS code lines on a computer screen for web development.

마이크로소프트, AI 에이전트 행동 제어 오픈 표준 ACS 공개

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
A modern humanoid robot with digital face and luminescent screen, symbolizing innovation in technology.

유아이패스, 코딩 에이전트 기업 자동화 통합 플랫폼 공개

2026년 06월 04일 14시 16분
two women sitting on a couch talking to each other

저항하는 내담자 시뮬레이터로 AI 심리상담 평가 개선 연구

2026년 06월 05일 10시 52분
Spacious modern atrium in a Shanghai building featuring minimalistic design with people sitting and walking.

AI가 법정에 쏟아낸 소송, 판사들의 고민

2026년 06월 05일 10시 42분
Flat lay of credit cards and smartphone on pink surface, symbolizing digital payment solutions.

AI 핀테크 스타트업 램프, 440억 달러 가치 평가로 7억5천만 달러 조달

2026년 06월 05일 10시 31분
샘 올트먼 오픈AI CEO

샘 알트먼 ‘AI 다음 단계는 상시 작동 선제형 AI’

2026년 06월 05일 10시 19분
Iconic neoclassical facade of the New York Stock Exchange with American flags.

AI 주가 랠리로 미국 가계 주식 비중 사상 최고치

2026년 06월 05일 10시 06분

검색

No Result
View All Result

인기 태그

AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI 허깅페이스

카테고리

  • AI 모델·연구 (246)
  • AI 서비스·툴 (113)
  • 반도체·인프라 (121)
  • 빅테크·기업 (113)
  • 산업 적용 (91)
  • 스타트업·투자 (64)
  • 정책·윤리 (108)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI 허깅페이스

최근 뉴스

two women sitting on a couch talking to each other

저항하는 내담자 시뮬레이터로 AI 심리상담 평가 개선 연구

2026년 06월 05일 10시 52분
Spacious modern atrium in a Shanghai building featuring minimalistic design with people sitting and walking.

AI가 법정에 쏟아낸 소송, 판사들의 고민

2026년 06월 05일 10시 42분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.