LLM 임상 의사결정 성능 자동 평가 벤치마크 EHRBench 공개
전자건강기록(EHR) 기반 임상 의사결정에서 LLM 성능을 자동·신뢰 가능하게 평가하는 EHRBench 벤치마크가 arXiv에 공개됐다.
전자건강기록(EHR) 기반 임상 의사결정에서 LLM 성능을 자동·신뢰 가능하게 평가하는 EHRBench 벤치마크가 arXiv에 공개됐다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.