씽킹머신랩, 풀덱플렉스 AI ‘TML-Interaction-Small’ 공개
전 OpenAI CTO 미라 무라티가 창업한 씽킹머신랩이 276B 파라미터 풀덱플렉스 멀티모달 모델을 공개했다. 응답 레이턴시 0.40초로 GPT 리얼타임 계열을 압도한다.
전 OpenAI CTO 미라 무라티가 창업한 씽킹머신랩이 276B 파라미터 풀덱플렉스 멀티모달 모델을 공개했다. 응답 레이턴시 0.40초로 GPT 리얼타임 계열을 압도한다.
거짓이라고 분명히 표시된 정보조차 대규모 언어모델이 사실로 받아들인다는 '부정 무시' 연구가 나왔다.
미니맥스가 100만 토큰 환경에서 응답 속도를 최대 15.6배 끌어올린 희소 어텐션 기술과 함께 차세대 모델 M3를 예고했다.
허깅페이스가 에이전트 분야에서 혼용되는 핵심 용어를 정리해 모델·하니스·스캐폴딩의 차이를 명확히 했다.
엔비디아가 토큰을 한 개씩 생성하는 기존 방식 대신 확산 기법을 적용한 텍스트 생성 모델 네모트론을 선보였다.
범용 AI 모델이 손글씨 해독 수준에 이르면서 기록보관소들이 방대한 필기 자료 전사에 LLM을 활용하기 시작했다.
오픈AI의 언어모델이 실제 응급실 기록을 활용한 임상 추론 과제에서 의사를 앞섰다는 연구가 발표됐다.
STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.