• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

스탠퍼드·람다랩스, 온디바이스 AI 에이전트 프레임워크 오픈자비스 공개

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 06일 12시 34분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

스탠퍼드대학교와 람다랩스(Lambda Labs) 공동 연구팀이 오픈소스 AI 에이전트 프레임워크 오픈자비스(OpenJarvis)를 공개했다. 클라우드 서버 없이 기기 내부(온디바이스)에서 AI 추론, 에이전트 구동, 메모리 관리, 학습까지 전 과정을 처리하는 것이 특징으로, 아파치(Apache) 2.0 라이선스로 배포된다. 연구팀이 2026년 5월 arXiv에 공개한 논문에 따르면, 오픈자비스로 구성한 로컬 모델이 8개 벤치마크 평균 정확도에서 최고 수준의 클라우드 모델과 3.2퍼센트포인트 차이에 그쳤으며, 쿼리당 한계 API 비용은 약 800배 낮고 지연시간은 약 4배 빠른 것으로 측정됐다.

프레임워크는 인텔리전스(모델·가중치), 엔진(추론 런타임), 에이전트(추론 루프·도구 정책), 도구·메모리(외부 인터페이스·검색 백엔드), 러닝(옵티마이저)의 다섯 가지 요소로 구성된다. 각 요소는 독립적으로 교체 가능하며, 단일 TOML 설정 파일(스펙)에 직렬화된다. 이를 통해 동일한 에이전트·도구 설정을 맥 미니(Mac Mini)와 고성능 워크스테이션에서 코드 수정 없이 공유할 수 있다. 프런티어 클라우드 모델을 탐색 시 교사로 활용해 성능 격차를 좁히는 LLM 기반 스펙 탐색 기술도 포함됐다. 연구팀에 따르면 이 방식은 단일 요소 최적화 방식 대비 클라우드·로컬 간 정확도 격차를 13~32퍼센트포인트 만회했으며, 추론 시에는 클라우드 호출 없이 온디바이스에서만 작동한다.

Close-up of hands holding a smartphone showing a mountain scene, captured outdoors in Banff.
사진: Line Knipst / Pexels

성능 검증은 7개 하드웨어 플랫폼에서 11개 로컬 모델을 대상으로 진행됐다. 최고 성능 로컬 단일 모델인 Qwen3.5-122B는 8개 벤치마크 평균 80.3%를 기록해, 클로드 오푸스(Claude Opus) 4.6의 83.5%와 3.2퍼센트포인트 차를 보였다. 도구 호출(ToolCall-15), 에이전트 워크플로(PinchBench), 코딩(LiveCodeBench), 고객 서비스(τ-Bench V2) 등 4개 벤치마크에서는 로컬 구성이 클라우드와 대등하거나 우세했다. 프레임워크는 지메일, 캘린더, 슬랙, 깃허브 등 25개 이상 데이터 소스와 왓츠앱, 텔레그램, 디스코드 등 32개 이상 메시징 채널을 지원하며, 단일 명령어로 설치 가능하다.

오픈자비스는 클라우드 AI 서비스 의존도를 줄이고 개인 데이터를 기기 내에 보관하면서도 고수준 에이전트 기능을 구현하려는 수요를 겨냥한다. 연구팀은 이전 연구 ‘지능 와트 효율(Intelligence Per Watt)’에서 로컬 모델이 단일 턴 채팅·추론 쿼리의 88.7%를 대화형 지연 수준에서 처리할 수 있으며, 2023년부터 2025년 사이 지능 효율이 5.3배 향상됐다고 밝힌 바 있다. 오픈자비스는 이 연구의 연장선에서 에이전트·메모리·학습까지 확장한 결과물이다.

Tags: AI에이전트OpenJarvis스탠퍼드오픈소스온디바이스AI
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Detailed close-up of a professional studio microphone with a blurred blue background.
AI 모델·연구

미소 랩스, 감정 표현 특화 80억 매개변수 TTS 모델 오픈웨이트 공개

2026년 06월 06일 13시 21분
Two workers handle a package in a spacious warehouse surrounded by shelves stocked with boxes and products.
AI 모델·연구

MetaPoint: 단일 토큰으로 이미지 생성 위치를 픽셀 수준으로 제어한다

2026년 06월 06일 12시 45분
Focused business analysis with charts and graphs on a laptop in a modern office setting.
AI 모델·연구

결측치 중 ‘의미 있는 공백’ 구별하는 확산 기반 프레임워크 Diff-Joint 제안

2026년 06월 06일 12시 24분
Close-up of stainless steel pipes with pressure gauges in an industrial setting.
AI 모델·연구

오토인코더로 제어 친화 축소 모델 학습하는 프레임워크 제안

2026년 06월 06일 12시 15분
Next Post
Two workers handle a package in a spacious warehouse surrounded by shelves stocked with boxes and products.

MetaPoint: 단일 토큰으로 이미지 생성 위치를 픽셀 수준으로 제어한다

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
From below of fiber optic equipment with similar colorful rubber cables and round sockets

엔비디아, 쿠버네티스 AI 추론 콜드스타트 단축 기술 ‘다이나모 스냅샷’ 공개

2026년 06월 06일 13시 49분
A man stands thoughtfully in a dimly lit control room with various screens.

NSA, 앤트로픽 사이버보안 AI 모델 ‘미토스’ 도입 준비 중 — FT 보도

2026년 06월 06일 13시 32분
Detailed close-up of a professional studio microphone with a blurred blue background.

미소 랩스, 감정 표현 특화 80억 매개변수 TTS 모델 오픈웨이트 공개

2026년 06월 06일 13시 21분
High-angle nighttime view of a modern urban skyscraper with rooftop garden.

마이크로소프트 MAI 모델, ‘라이선스 데이터’ 약속과 달리 크롤 데이터 사용

2026년 06월 06일 13시 11분
Closeup of a hand with polka dot nails typing on a vintage keyboard, emphasizing retro technology.

마이크로소프트 Fara, 구글 Colab에서 브라우저 제어 에이전트 실습 가능

2026년 06월 06일 13시 02분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 온디바이스AI 의료AI 자율주행 젠슨황 클로드 피지컬AI

카테고리

  • AI 모델·연구 (289)
  • AI 서비스·툴 (143)
  • 반도체·인프라 (152)
  • 빅테크·기업 (138)
  • 산업 적용 (123)
  • 스타트업·투자 (76)
  • 정책·윤리 (131)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 앤트로픽 에이전트 에이전틱AI 엔비디아 오픈AI 오픈소스 온디바이스AI 의료AI 자율주행 젠슨황 클로드 피지컬AI

최근 뉴스

From below of fiber optic equipment with similar colorful rubber cables and round sockets

엔비디아, 쿠버네티스 AI 추론 콜드스타트 단축 기술 ‘다이나모 스냅샷’ 공개

2026년 06월 06일 13시 49분
A man stands thoughtfully in a dimly lit control room with various screens.

NSA, 앤트로픽 사이버보안 AI 모델 ‘미토스’ 도입 준비 중 — FT 보도

2026년 06월 06일 13시 32분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

스토리움(STORIUM)  |  상호: [[상호]]  |  대표: [[대표자명]]  |  사업자등록번호: [[000-00-00000]]
인터넷신문 등록번호: [[등록 후 입력]]  |  발행인: [[발행인]]  |  편집인: [[편집인]]  |  청소년보호책임자: STORIUM 편집부
주소: [[사업장 주소]]  |  이메일: lee.kkhwan@gmail.com
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

스토리움(STORIUM)  |  상호: [[상호]]  |  대표: [[대표자명]]  |  사업자등록번호: [[000-00-00000]]
인터넷신문 등록번호: [[등록 후 입력]]  |  발행인: [[발행인]]  |  편집인: [[편집인]]  |  청소년보호책임자: STORIUM 편집부
주소: [[사업장 주소]]  |  이메일: lee.kkhwan@gmail.com
© 2026 STORIUM. All Rights Reserved.