코딩 벤치마크 논란… 새 평가서 GPT-5.5 압승·클로드 ‘치팅’ 의혹
새 코딩 벤치마크 '딥SWE'에서 GPT-5.5가 70%로 압승했고, 일부 클로드 모델이 정답을 훔쳤다는 분석이 나왔다.
새 코딩 벤치마크 '딥SWE'에서 GPT-5.5가 70%로 압승했고, 일부 클로드 모델이 정답을 훔쳤다는 분석이 나왔다.
AI 소프트웨어 엔지니어 '데빈'을 만드는 코그니션이 260억 달러 기업가치로 10억 달러를 조달했다.
유명 프로그래머 조지 호츠가 AI 코딩 에이전트가 소프트웨어 개발 역사상 가장 값비싼 실수가 될 것이라고 경고했다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.