울산과학기술원(UNIST) 인공지능대학원 주경돈 교수 연구팀이 사용자가 입력한 단어나 문장으로 3D 공간 속 물체를 찾아내는 AI 기술 ‘라이트스플랫(LightSplat)’을 개발했다. 이 기술은 사전에 정의된 범주에 국한되지 않고 ‘흰색 소파’, ‘라면 위 달걀’ 등 다양한 자연어 표현으로 특정 대상을 탐색하는 오픈어휘(Open-Vocabulary) 기반 3D 공간 인식 기술이다. 연구 결과는 컴퓨터 비전 분야 권위 학회 CVPR 2026(Conference on Computer Vision and Pattern Recognition)에서 발표됐으며, 학회는 지난 6월 3~5일 미국 덴버에서 열렸다.
라이트스플랫은 기존 오픈어휘 3D 공간 인식 기술과 비교해 메모리 사용량을 64분의 1 수준으로 낮췄다. 3D 가우시안(Gaussian) 점 입자에 의미 정보를 연결해 자연어로 검색 가능하게 만드는 준비 시간도 약 5초에 불과하며, 이는 기존 최신 기술보다 50~400배 빠른 속도다. 이 같은 성능 향상은 각 점 입자에 긴 숫자 형태의 언어 특징값을 직접 저장하는 대신 2바이트짜리 짧은 인덱스만 부여하고, 실제 의미 정보는 별도 표에 저장해 필요 시 참조하는 방식으로 구현됐다. 메모리와 검색 준비 시간을 모두 줄이면서도 물체 인식 성능은 기존 기술보다 뛰어난 결과를 실험에서 보였다.
연구팀은 실험에서 라이트스플랫이 유리잔에 담긴 차, 라면 위 달걀처럼 작은 대상부터 멀리 있는 자동차, 사무실 가구처럼 크기와 배치가 다양한 물체까지 정확하게 구분해냈다고 설명했다. 3D 공간 인식은 로봇이나 증강현실(AR) 기기가 카메라 영상을 해석해 주변 환경의 물체 위치와 영역을 파악하는 핵심 기술이다. 오픈어휘 방식은 미리 학습된 범주에 없는 물체도 텍스트 설명만으로 인식할 수 있어 현실 환경에 더 유연하게 대응할 수 있다는 장점이 있다.
주경돈 교수는 이 기술이 자연어 지시를 바로 수행하는 로봇 개발, 텍스트로 대상을 지정하는 AR·VR 콘텐츠 제작, 디지털 트윈 등 다양한 분야에 적용 가능하다고 밝혔다. 이번 연구는 과학기술정보통신부와 정보통신기획평가원의 인공지능대학원 지원사업을 통해 수행됐다.














