Z.ai, GLM-5.2 공개…100만 토큰 컨텍스트·벤치마크 없이 출시

중국 AI 기업 Z.ai가 2026년 6월 13일 대규모 언어 모델 GLM-5.2를 공개했다. 이번 출시는 GLM-5(2월), GLM-5-Turbo(3월), GLM-5.1(4월)에 이은 GLM-5 계열의 네 번째 릴리즈로, 약 4개월 만에 주요 코딩 특화 모델을 잇달아 선보인 셈이다. GLM-5.2는 글로벌 코딩 플랜 전 티어(Lite·Pro·Max·Team)에서 즉시 사용할 수 있도록 제공됐다.

GLM-5.2의 핵심 사양은 100만 토큰 컨텍스트 창이다. 이전 버전인 GLM-5.1이 약 20만 토큰 창을 지원한 데 비해 약 5배 확장됐다. 단일 요청당 최대 13만 1,072개의 출력 토큰을 처리할 수 있어, 중간 규모 코드베이스 전체를 하나의 세션에 올려 두고 작업하는 방식이 현실적으로 가능해졌다. 요약·재로딩 없이 소스 파일·테스트·설정·대화 이력을 한꺼번에 유지할 수 있다는 점이 실용적 이점으로 꼽힌다. 추론 강도는 High와 Max 두 단계로 나뉘며, 복잡한 다단계 코딩 작업에는 Max 설정을 권장한다.

GLM-5.2는 Anthropic 호환 엔드포인트를 지원해 클로드 코드(Claude Code), Cline, OpenCode, OpenClaw 등 8개 에이전트 툴과 기본 연동된다. 설정 파일에서 기본 URL과 모델 식별자만 교체하면 기존 에이전트 환경을 그대로 활용할 수 있다. 라이선스는 MIT를 채택했으며, 가중치는 출시 후 일주일 이내 공개할 예정이라고 밝혔다. 단, 출시 시점에 SWE-bench나 Code Arena 같은 벤치마크 점수는 공개하지 않았다. 비교를 위한 GLM-5.1의 SWE-bench Pro 점수는 58.4였다.

아키텍처에 대해 Z.ai는 출시 자료에서 별도로 명시하지 않았다. 커뮤니티 분석에 따르면 GLM-5 기반 모델은 7,440억 파라미터 규모의 혼합전문가(Mixture-of-Experts) 구조로, 토큰당 400억 파라미터를 활성화하는 것으로 알려졌다. GLM-5.2가 이 구조를 동일하게 유지하는지 여부는 공식 확인을 통해 파악해야 한다. Z.ai는 벤치마크 공개 없이 제품 가용성과 컨텍스트 사양, 오픈소스 로드맵에 초점을 맞춰 발표를 진행했으며, 수치 기반 성능 비교는 후속 발표로 미뤄진 상태다.