• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

Holo3.1, 로컬 실행 가능한 컴퓨터 제어 AI 에이전트 공개

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 04일 15시 28분
Reading Time: 1 min read
A A
Home 반도체·인프라
Share on FacebookShare on Twitter

H컴퍼니(Hcompany)가 컴퓨터 직접 제어(Computer Use) AI 에이전트 패밀리 Holo3.1을 공개했다. 이 모델은 웹·데스크톱·모바일 세 가지 환경에서의 안정성을 동시에 개선하고, 다양한 서드파티 에이전트 프레임워크에서의 호환성을 높인 것이 핵심 특징이다. 전작 Holo3와 달리 이번 릴리스부터는 양자화(quantization) 체크포인트가 처음으로 제공돼 클라우드가 아닌 로컬 기기에서도 실행할 수 있는 배포 유연성을 갖췄다.

모바일 자동화 성능에서 Holo3.1은 주목할 만한 도약을 이뤄냈다. AndroidWorld 벤치마크에서 35B-A3B 모델은 67%에서 79.3%로 향상됐으며, 4B·9B 소형 모델도 58%에서 72%로 크게 올랐다. 서드파티 에이전트 스택과의 호환성 확보를 위해 기존 구조화된 JSON 출력 방식에 더해 함수 호출(function-calling) 프로토콜을 새로 지원하며, OSWorld와 내부 전자상거래·비즈니스 소프트웨어·협업 도구 벤치마크에서 두 방식의 성능이 사실상 동등한 수준에 도달했다. 또한 Holotab 제품 환경 내 평가에서는 전작 대비 25% 이상 성능이 향상됐다.

Holo3.1은 0.8B·4B·9B·35B-A3B 네 가지 크기로 출시됐다. 특히 로컬 추론을 겨냥해 35B-A3B 기준으로 FP8·Q4 GGUF·NVFP4 양자화 체크포인트를 함께 제공한다. 엔비디아(NVIDIA) DGX Spark 환경에서 NVFP4(W4A16 구성)는 FP8 대비 토큰 처리량이 1.41배, BF16 대비 1.74배 높았다. 에이전트 환경 최적화와 NVFP4 양자화를 결합하면 단계당 평균 처리 시간이 6.8초에서 3.3초로 약 2배 단축된다고 밝혔다. Q4 GGUF 체크포인트는 윈도우 또는 맥 기기에서 에이전트 전체가 로컬로 실행되며, 사용자의 네트워크 밖으로 데이터가 나가지 않는 완전 프라이빗 배포를 지원한다.

Holo3.1은 허깅페이스(Hugging Face)를 통해 모델 가중치가 공개됐으며, Holo Models API를 통한 클라우드 추론도 제공된다. AI 에이전트의 생산 환경 배포가 늘어나는 가운데, 단일 환경에서의 강한 성능이 다른 환경에서는 재현되지 않는 분포 이동(distribution shift) 문제를 체계적으로 해결했다는 점에서 실무 개발자들의 관심을 끌고 있다. 엣지 기기와 소비자용 하드웨어에서 AI 에이전트를 운용하려는 수요가 커지면서, 로컬 추론 성능을 끌어올린 이 릴리스는 컴퓨터 제어 에이전트 시장에서 경쟁 기준을 높이는 계기가 될 전망이다.

Tags: Holo3.1HuggingFaceH컴퍼니로컬AI컴퓨터제어에이전트
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Aerial shot of a large-scale construction project with cranes in Đồng Nai, Việt Nam.
반도체·인프라

국가AI컴퓨팅센터 SPC 이달 출범…본사 전남 해남, 삼성SDS 최대주주

2026년 06월 05일 17시 44분
Detailed close-up of a golden microprocessor chip, ideal for technology concepts.
반도체·인프라

AI 에이전트 시대, CPU 수요 급증…인텔에 물량 전화 쇄도

2026년 06월 05일 17시 40분
젠슨 황 엔비디아 CEO
반도체·인프라

젠슨 황, 방한 중 엔씨·크래프톤 회동… AI 노트북·피지컬 AI 협력 논의

2026년 06월 05일 17시 14분
젠슨 황 엔비디아 CEO
반도체·인프라

젠슨 황, 방한해 SK·현대차·LG·네이버 총수와 AI 협력 회동

2026년 06월 05일 16시 29분
Next Post
코드 편집 화면에 뜬 AI 코딩 어시스턴트의 작업 메뉴(코드 설명·문제 탐색·코드 생성 등)

오픈AI 코덱스, 주간 활성 사용자 500만 명 돌파하며 지식 노동 도구로 확장

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
Woman enjoying virtual reality with VR headset against vibrant orange background.

KAIST 메타버스대학원, KMF 2026서 공간 AI·XR 연구 성과 공개

2026년 06월 05일 18시 00분
Young woman managing a fashion boutique, multitasking with phone and laptop, surrounded by clothing.

네이블, 패션 브랜드 메트로시티에 AICC 솔루션 공급

2026년 06월 05일 17시 56분
Detailed view of a cutting-edge industrial robotic arm in action.

이미지스, Physical AI 센서 결합 신사업으로 성장동력 확보 나서

2026년 06월 05일 17시 52분
Diverse group of students studying in a computer-equipped classroom setting.

컴투스·성균관대, AI 게임 개발자 양성과정 1기 모집 시작

2026년 06월 05일 17시 47분
Aerial shot of a large-scale construction project with cranes in Đồng Nai, Việt Nam.

국가AI컴퓨팅센터 SPC 이달 출범…본사 전남 해남, 삼성SDS 최대주주

2026년 06월 05일 17시 44분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini GPU IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

카테고리

  • AI 모델·연구 (278)
  • AI 서비스·툴 (122)
  • 반도체·인프라 (133)
  • 빅테크·기업 (121)
  • 산업 적용 (109)
  • 스타트업·투자 (69)
  • 정책·윤리 (116)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini GPU IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

최근 뉴스

Woman enjoying virtual reality with VR headset against vibrant orange background.

KAIST 메타버스대학원, KMF 2026서 공간 AI·XR 연구 성과 공개

2026년 06월 05일 18시 00분
Young woman managing a fashion boutique, multitasking with phone and laptop, surrounded by clothing.

네이블, 패션 브랜드 메트로시티에 AICC 솔루션 공급

2026년 06월 05일 17시 56분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.