앤서와이즈 AWAXIS-KR-31B-v5, K-AI 리더보드 종합 1위 달성

국내 인공지능 기업 앤서와이즈가 자사 대규모 언어 모델(LLM) AWAXIS-KR-31B-v5를 통해 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 공동 운영하는 K-AI 리더보드에서 종합 1위를 기록했다고 2026년 6월 5일 밝혔다. 해당 모델은 평균 0.582점을 획득하며 공개 평가 전 항목에서 최상위를 차지했다.

세부 평가 지표를 살펴보면 한국어 전문지식 평가인 KMMLU-Pro에서 0.724점, 한국 문화·언어 이해도를 측정하는 CLIcK에서 0.848점을 기록했다. 고난도 논리 추론 항목 HLE(Ko)는 0.077점, 복합 문맥 이해를 평가하는 MuSR(Ko)에서는 0.638점, 상황 대화 의도 파악 지표 Com2-main(Ko)에서는 0.626점을 각각 얻었다. K-AI 리더보드는 국내 연구기관과 기업이 개발한 LLM의 한국어 실용 성능을 비교·검증하는 공개 플랫폼으로, 실제 한국어 AI 활용성과 직결된 지표들로 구성돼 있다.

High-quality image of various computer components, including RAM and CPUs, on a white background. — 사진: Andrey Matveev / Pexels

앞서 앤서와이즈는 전작 모델인 AWAXIS-Hybrid-28B가 K-AI 리더보드 상위권에 진입한 이후, 모델 구조 개선과 한국어 추론 성능 고도화 작업을 지속해 왔다. 이번 1위 달성에는 AI 모델 개발 역량을 보유한 비드래프트와의 기술 협력이 병행됐다. 회사는 이번 성과를 단순 순위 경쟁의 결과가 아니라, AI가 실제 기기와 업무 환경에서 직접 호출·실행되는 방향으로 발전하는 실행형 AI 기술의 기반 확보 과정으로 설명했다.

앤서와이즈는 향후 AWAXIS 계열 모델을 기반으로 한국어 AI 성능을 지속 개선하는 한편, 온보드 AI와 물리적 AI 인터페이스, 사용자 업무 패턴을 구조화하는 실행 자산화 기술을 단계적으로 발전시킬 계획이라고 밝혔다. 회사 측은 “한국어 AI 모델 고도화 방향이 공개 평가에서 성과로 이어지고 있다”며 “AI가 실제 업무와 창작 환경에서 더 쉽게 활용될 수 있는 AX(AI Transformation) 기술을 계속 발전시켜 나가겠다”고 전했다.