• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

WALL-WM, 이벤트 단위 로봇 행동 학습 모델 제안

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 04일 15시 29분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

연구팀이 로봇의 비디오-행동 학습 방식을 기존 고정 길이 청크 중심에서 의미론적 이벤트 기반으로 전환하는 세계 행동 모델(WAM) WALL-WM을 제안했다. 기존 세계 행동 모델들은 멀티모달 또는 비디오 파운데이션 모델을 초기화 기반으로 삼아 현재 관측과 지시에 조건부로 고정 길이 행동 청크를 예측하는 방식을 채택해 왔다. 이 방식은 구현이 편리하지만 언어는 의미론적 목표와 이벤트를 표현하고, 시각 정보는 연속적인 장면 변화로 전개되며, 행동은 제어 수준의 시간 척도로 작동한다는 세 영역 간의 근본적인 입도(granularity) 불일치 문제를 안고 있다는 것이 연구팀의 지적이다.

WALL-WM은 이 불일치를 해소하기 위해 지도 학습과 데이터 구성 모두를 의미론적 이벤트 중심으로 재편한다. 이벤트 기반 VLA(비전-언어-행동) 사전 학습을 이벤트 단위 캡션과 클러스터 균형 샘플링으로 구축한 데이터 생태계와 결합함으로써, 다양한 행동 유형과 장면, 과제 구조에 걸쳐 확장 가능한 학습을 가능케 한다. 추론 시에는 다음 이벤트 서술을 입력 받아 가변 길이 실행 청크를 처리하는 이벤트 모드와, VLM에 계단식 디코딩(Staircase Decoding)을 적용해 기존 고정 길이 청크 추론을 유지하는 통합 모드를 함께 지원한다.

A white and black toy humanoid robot in a studio setting casting a shadow.
사진: Pavel Danilyuk / Pexels

WALL-WM은 Muon 옵티마이저 기반의 대규모 사전 학습 인프라와 결합해 범용 세계 행동 모델의 규모 확장을 위한 실용적인 방법론을 제시한다. 실험에서는 언어, 장면, 과제 등 다양한 조건에 걸쳐 광범위한 일반화 능력을 보였으며, 대규모 실세계 일반화 평가에서 최고 수준의 성능을 달성했다고 연구팀은 밝혔다. 이 연구는 고정된 예측 창에 강제로 끼워 맞추는 기존 접근의 한계를 벗어나, 언어·시각·행동의 자연스러운 시간 단위를 존중하는 로봇 학습의 방향성을 제시한다는 데 의미가 있다.

Tags: VLAWALL-WM로봇학습비전언어행동세계행동모델
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

The grand neoclassical architecture of MIT building showcasing its historic significance.
AI 모델·연구

MIT·조지아주립대, 커뮤니티칼리지 AI 취업 연계 프로그램 PATH 확대

2026년 06월 05일 16시 50분
Researchers examining a robotic arm, showcasing technology and innovation.
AI 모델·연구

NSF, MIT 주도 AI·물리학 융합 연구소 5년 추가 지원 확정

2026년 06월 05일 16시 46분
A close-up view of a rusty padlock securing a weathered metal door, highlighting decay and security.
AI 모델·연구

엔비디아, 멀티모달·다국어 AI 안전 모델 ‘네모트론 3.5’ 공개

2026년 06월 05일 16시 41분
Studio shot of a humanoid robot with glowing eyes against a dark background, offering ample copyspace.
AI 모델·연구

사회과학자 1260명 조사: AI 코딩 에이전트 사용 20%에 그쳐

2026년 06월 05일 15시 43분
Next Post
Man delivering a package at a front door, wearing a red shirt and cap.

아마존, Ring 안면인식 기능 무동의 수집 혐의로 집단소송 직면

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
AMD EPYC 프로세서 다이(칩) 근접 촬영

AMD, 6세대 EPYC ‘베니스’ 2nm 양산 돌입… HPC 제품 최초

2026년 06월 04일 15시 19분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
Woman enjoying virtual reality with VR headset against vibrant orange background.

KAIST 메타버스대학원, KMF 2026서 공간 AI·XR 연구 성과 공개

2026년 06월 05일 18시 00분
Young woman managing a fashion boutique, multitasking with phone and laptop, surrounded by clothing.

네이블, 패션 브랜드 메트로시티에 AICC 솔루션 공급

2026년 06월 05일 17시 56분
Detailed view of a cutting-edge industrial robotic arm in action.

이미지스, Physical AI 센서 결합 신사업으로 성장동력 확보 나서

2026년 06월 05일 17시 52분
Diverse group of students studying in a computer-equipped classroom setting.

컴투스·성균관대, AI 게임 개발자 양성과정 1기 모집 시작

2026년 06월 05일 17시 47분
Aerial shot of a large-scale construction project with cranes in Đồng Nai, Việt Nam.

국가AI컴퓨팅센터 SPC 이달 출범…본사 전남 해남, 삼성SDS 최대주주

2026년 06월 05일 17시 44분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini GPU IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

카테고리

  • AI 모델·연구 (278)
  • AI 서비스·툴 (122)
  • 반도체·인프라 (133)
  • 빅테크·기업 (121)
  • 산업 적용 (109)
  • 스타트업·투자 (69)
  • 정책·윤리 (116)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI 에이전트 AI윤리 AI인프라 Anthropic arXiv AWS ChatGPT Claude Gemini GPU IPO LLM MCP Meta Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 로봇 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 스타트업 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

최근 뉴스

Woman enjoying virtual reality with VR headset against vibrant orange background.

KAIST 메타버스대학원, KMF 2026서 공간 AI·XR 연구 성과 공개

2026년 06월 05일 18시 00분
Young woman managing a fashion boutique, multitasking with phone and laptop, surrounded by clothing.

네이블, 패션 브랜드 메트로시티에 AICC 솔루션 공급

2026년 06월 05일 17시 56분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.