프런티어 모델, 기업 IT 운영 벤치마크서 50% 미달… ‘ITBench-AA’ 공개
최상위 AI 모델들이 기업 IT 운영을 다루는 새 벤치마크 ITBench-AA에서 모두 50%를 넘기지 못했다.
최상위 AI 모델들이 기업 IT 운영을 다루는 새 벤치마크 ITBench-AA에서 모두 50%를 넘기지 못했다.
구글이 며칠씩 걸리는 복잡한 작업을 안정적으로 수행하는 기업용 AI 에이전트 런타임 'AX'를 오픈소스로 공개했다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.