• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

VibeThinker-3B, AIME26 94.3점…DeepSeek V3.2(671B)급 수학·코딩 추론 성능

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 21일 14시 58분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

중국 시나웨이보(Sina Weibo) 연구팀이 30억 파라미터 소형 추론 모델 VibeThinker-3B를 MIT 라이선스로 공개했다. 이 모델은 AIME26(미국 수학올림피아드 초청 시험 2026) 벤치마크에서 94.3점을 기록해 6710억 파라미터 규모의 DeepSeek V3.2(94.2점), 1조 파라미터 규모의 Kimi K2.5(93.3점)와 거의 동일한 수준을 보였다. 수학·코딩·STEM 분야의 검증 가능한 추론 과제에 특화된 전문 모델로, BF16 가중치 기준 약 6GB라 단일 GPU에서 구동할 수 있다.

VibeThinker-3B는 코딩 특화 베이스 모델인 Qwen2.5-Coder-3B 위에 지도 미세조정(SFT)과 강화학습(RL), 자기증류(Self-Distillation)를 순차로 쌓는 방식으로 구성됐다. 연구팀은 이를 ‘스펙트럼-투-시그널 파이프라인(Spectrum-to-Signal Pipeline, SSP)’이라 명명했다. SSP는 SFT로 다양한 올바른 추론 경로(‘스펙트럼’)를 쌓은 뒤, RL이 그 중 정확한 경로(‘시그널’)를 증폭하는 구조다. 커리큘럼 기반 SFT, MGPO(MaxEnt-Guided Policy Optimization) 기반 추론 RL, 오프라인 자기증류, 지시 준수를 높이는 Instruct RL의 네 단계로 진행된다.

VibeThinker-3B: A 3B Dense Reasoning Model Built on Qwen2.5-Coder-3B With the Spectrum-to-Signal Post-Training Pipeline
이미지 출처: 원문 (VibeThinker-3B: A 3B Dense Reasoning Model Built on Qwen2.5-Coder-3B With the Spectrum-to-Signal Post-Training Pipeline)

벤치마크 성능은 여러 지표에서 확인된다. AIME26 94.3점 외에 HMMT25 89.3점, IMO-AnswerBench 76.4점, LiveCodeBench v6 80.2점(Pass@1), GPQA-Diamond 70.2점을 기록했다. 테스트 시 스케일링 기법인 CLR(Claim-Level Reliability Assessment)을 적용하면 AIME26 97.1점, HMMT25 95.4점으로 올라간다. CLR은 문제당 32개의 추론 경로를 생성하고 각 경로에서 5개의 핵심 주장을 추출해 모델이 자체 검증하는 방식으로, 파라미터 추가 없이 계산량으로 성능을 높인다. 실제 LeetCode 대회 문제 128문제 중 123문제를 파이썬 첫 제출에 통과시켜 96.1% 수락률을 기록하기도 했다. 다만 GPQA-Diamond처럼 폭넓은 지식이 요구되는 벤치마크에서는 대형 모델과의 격차가 뚜렷하다.

이 연구의 의의는 ‘규모 대신 훈련 방법론’이라는 명제를 구체적 숫자로 입증했다는 데 있다. DeepSeek V3.2·Kimi K2.5처럼 수백억~수천억 파라미터 모델이 상위 벤치마크를 점령한 환경에서, 30억 파라미터로 경쟁력 있는 수학·코딩 추론이 가능하다는 것을 실증했다. MIT 라이선스 공개라 상업적 사용 제한이 없어 스타트업이나 연구 기관이 비용 효율적인 추론 에이전트의 기반 모델로 즉시 활용할 수 있다. 단일 GPU에서 구동되는 6GB 규모는 온프레미스 배포를 선호하는 금융·보안 분야에도 매력적이며, SSP처럼 포스트 트레이닝만으로 대형 모델에 근접한 추론 성능을 내는 방법론이 확산되면 리소스가 제한된 연구 그룹도 경쟁력 있는 추론 모델을 개발할 수 있는 문턱이 낮아진다는 전망이 나온다.

Tags: AIMEQwen2.5VibeThinker소형언어모델오픈소스AI추론모델
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

주조 공정에서 흘러나오는 용융 금속 - 금속합금 시뮬레이션
AI 모델·연구

MIT, 머신러닝으로 금속합금 원자 시뮬레이션 정확도 대폭 높인 방법 공개

2026년 06월 22일 14시 18분
Dynamic urban scene showcasing interconnected light trails representing digital communication networks.
AI 모델·연구

KAIST, AI 환각 줄이고 정확도 78% 높인 통합 DB ‘AkasicDB’ 개발

2026년 06월 22일 13시 03분
칠판에 적힌 수학·화학 공식 — AI 필즈상 수학 증명 형식화 프로젝트
AI 모델·연구

AI, 필즈상 수학 증명 형식화 프로젝트 5일 만에 완료

2026년 06월 22일 12시 56분
Two students studying outdoors with laptops on a university campus during the day.
AI 모델·연구

AI가 학점을 올린다, UC버클리 연구 ‘학습 아닌 외주’ 신호

2026년 06월 22일 12시 40분
Next Post
Google office in Toronto

구글, TPU 외부 판매·데이터센터 금융보증…엔비디아식 AI 칩 전략 구사

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
Close-up of a GeForce RTX graphics card on a desk, showcasing its design and technology.

엔비디아 RTX Spark, 윈도 노트북 판도 바꿀까…가격 걸림돌

2026년 06월 13일 09시 29분
Contemporary building with a glass facade and geometric patterns, low angle view.

앤트로픽·네이버 개발자 밋업 개최…서울 오피스 개소 앞두고 본사 임원 참석

2026년 06월 15일 20시 45분
책상에서 법률 문서에 서명하는 모습

클로드 ‘드리밍’ 기능 공개…앤트로픽, 법률·의료 AI 성능 대폭 향상

2026년 06월 15일 20시 45분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
Close-up of a laptop displaying Adobe software icons, beside a camera on a desk.

어도비 2분기 호실적에도 주가 흔들…AI SaaS 수익화 과제

2026년 06월 22일 18시 35분
Kids amazed by a humanoid robot during an indoor play session, showcasing technology and learning.

피지컬 AI 얼라이언스 2기 출범, 풀스택 기술·국제표준 선도 목표

2026년 06월 22일 18시 30분
Business professional at the desk examining a software development agreement document.

포시에스, 전자문서 기반 기업용 AI 에이전트 플랫폼 AIOZ EKA 첫 공개

2026년 06월 22일 18시 23분
Close-up of a laptop screen displaying code, set against a dark backdrop with blue lighting for a tech-focused ambiance.

포스코DX, ‘1인 N에이전트’ 선언…AX 해커톤 2026에 75팀 188명 참여

2026년 06월 22일 18시 16분
앤트로픽 뉴스룸 - 미국 정부 수출통제 지침 관련 공식 발표 화면

앤트로픽 수출통제 사태 이후 한국, AI 주권과 신뢰 파트너 조건 동시 확보해야

2026년 06월 22일 18시 07분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS AX ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

카테고리

  • AI 모델·연구 (735)
  • AI 서비스·툴 (391)
  • 반도체·인프라 (296)
  • 빅테크·기업 (343)
  • 산업 적용 (257)
  • 스타트업·투자 (163)
  • 정책·윤리 (287)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS AX ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

최근 뉴스

Close-up of a laptop displaying Adobe software icons, beside a camera on a desk.

어도비 2분기 호실적에도 주가 흔들…AI SaaS 수익화 과제

2026년 06월 22일 18시 35분
Kids amazed by a humanoid robot during an indoor play session, showcasing technology and learning.

피지컬 AI 얼라이언스 2기 출범, 풀스택 기술·국제표준 선도 목표

2026년 06월 22일 18시 30분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.