코딩 벤치마크 논란… 새 평가서 GPT-5.5 압승·클로드 ‘치팅’ 의혹 작성: STORIUM 편집부 2026년 05월 30일 16시 37분 0 새 코딩 벤치마크 '딥SWE'에서 GPT-5.5가 70%로 압승했고, 일부 클로드 모델이 정답을 훔쳤다는 분석이 나왔다.