AI 기업들, 로봇 훈련 데이터 위해 가사 노동 영상 수집

복수의 AI 기업들이 가정용 로봇 학습에 필요한 물리적 동작 데이터 확보를 위해 일반인의 가사 노동 영상을 수집하는 프로그램을 운영 중이라고 더 버지(The Verge)가 보도했다. 로봇이 설거지·청소·빨래 개기 같은 일상 동작을 수행하려면 수백만 건의 실제 인간 동작 영상이 필요한데, 이를 확보하는 것이 물리 AI(physical AI) 개발의 핵심 병목으로 꼽힌다. 피규어 AI(Figure AI), 피지컬 인텔리전스(Physical Intelligence) 등 휴머노이드·로봇 기업들이 실세계 동작 데이터 확보에 주력하는 가운데, 데이터 수집을 전문으로 하는 스타트업들도 이 시장에 뛰어들고 있는 것으로 전해진다.

수집 방식은 다양하다. 일부 기업은 참여자가 스마트폰이나 웨어러블 카메라로 가사 장면을 촬영해 제출하면 현금이나 포인트를 지급한다. 한 스타트업은 무료 청소 서비스를 제공하는 대신 해당 작업 영상을 확보하는 방식을 시험 중인 것으로 전해졌다. 데이터 라벨링 플랫폼들도 로봇 훈련용 고품질 동작 어노테이션(annotation) 작업 수요가 급증하고 있다고 밝혔다. 이 과정에서 가정 내 사생활 침해와 데이터 소유권 문제가 새로운 윤리적 쟁점으로 부각되고 있다.

A robotic helper cracks an egg into a bowl in a contemporary kitchen setting, showcasing automation in cooking. — 사진: Kindel Media / Pexels

구글 딥마인드(Google DeepMind), 아마존(Amazon), 마이크로소프트(Microsoft) 등 빅테크 역시 로보틱스 파운데이션 모델 구축에 공을 들이고 있으며, 이를 위한 대규모 실세계 데이터셋 구축이 필수 과제로 떠올랐다. 텍스트나 이미지 데이터와 달리 로봇 동작 데이터는 인터넷에서 대량으로 긁어올 수 없어, 사람을 직접 동원하는 방식이 불가피하다. 물리적 AI 학습 데이터의 희소성이 향후 로봇 산업의 경쟁 우위를 가를 핵심 자원으로 자리매김하고 있다.

가사 노동 영상이 AI 학습 자산으로 재정의되는 흐름은 데이터 경제의 새로운 국면을 보여준다. 데이터 제공자의 권리 보호와 공정한 보상 체계를 둘러싼 사회적 논의가 기술 발전 속도를 따라잡지 못하고 있다는 지적이 제기되는 상황이다.