전기및전자공학부 유창동 교수팀, VOTP 개발… ICML 2026 구두 발표 논문 선정

KAIST 연구진이 단 몇 개의 선호 영상만으로 AI가 인간의 의도와 판단 기준을 학습할 수 있는 피지컬 AI 핵심 기술을 개발했다. 로봇이나 자율주행차, AI 에이전트가 인간이 선호하는 행동을 적은 데이터로 학습할 수 있도록 하는 기술로, 피지컬 AI 개발에 필요한 인간 평가 데이터 구축 비용과 시간을 줄일 수 있을 것으로 기대된다.

KAIST는 전기및전자공학부 유창동 교수 연구팀이 수천~수만 건의 인간 평가 데이터 없이도 AI가 인간의 의도와 판단 기준을 학습할 수 있는 새로운 기술인 ‘VOTP(Video-based Optimal TransPort Preference)’를 세계 최초로 개발했다고 10일 밝혔다. 연구팀의 논문은 오는 7월 서울 코엑스에서 열리는 국제 AI 학회 ICML 2026에 채택됐으며, 전체 제출 논문 2만3,918편 가운데 상위 0.7%인 168편에만 주어지는 구두 발표 논문으로 선정됐다.

최근 AI 기술은 텍스트와 이미지를 생성하는 수준을 넘어 실제 기계를 움직이고 현실 세계에서 행동하는 피지컬 AI로 확장되고 있다. 공장에서 위험한 작업을 대신 수행하는 로봇, 도로 상황을 판단하는 자율주행차, 정교한 수술을 수행하는 의료 로봇 등이 대표적인 사례다.

피지컬 AI가 실제 환경에서 작동하기 위해서는 기계가 수행한 행동이 인간의 의도에 맞는지, 어떤 행동이 더 바람직한지를 판단하는 기준을 배워야 한다. 자율주행차가 복잡한 교차로를 통과하거나 수술 로봇이 봉합을 수행할 때, AI는 여러 선택지 가운데 인간의 기대에 부합하는 행동을 골라야 한다. 이를 위해 필요한 것이 보상함수다. 보상함수는 AI가 어떤 행동을 좋은 행동으로 평가할지 정하는 기준이다.

기존에는 이러한 보상함수를 구축하기 위해 사람이 수천~수만 개의 행동 데이터를 직접 평가해야 했다. 이 과정에는 많은 시간과 비용이 들었고, 피지컬 AI 상용화의 주요 장벽으로 지적돼 왔다. 연구팀은 사람이 몇 번의 시범만 보고도 새로운 일을 배운다는 점에 주목해, 좋은 사례와 나쁜 사례가 담긴 소수의 비디오만으로 AI가 인간의 선호를 학습하는 방식을 제안했다.

VOTP는 사람이 제공한 몇 개의 좋은 시범 영상과 나쁜 시범 영상을 바탕으로 AI가 행동의 미세한 차이를 파악하고, 인간이 선호하는 행동 패턴을 유추하도록 설계된 프레임워크다. 연구팀은 최신 비디오 인공지능의 시각적 이해 능력과 데이터 간 관계를 수치화하는 최적 전송 기법을 결합했다.

이번 기술은 피지컬 AI 개발에 필요한 인간 피드백과 데이터 구축 비용을 크게 줄일 수 있다. 적은 수의 사례만으로도 로봇과 자율주행차, 산업용 기계가 사람의 기대에 부합하는 행동을 학습할 수 있어 개발 기간과 비용을 단축할 수 있다는 설명이다.

응용 분야도 넓다. 연구팀은 VOTP가 로봇 팔 제어, 휴머노이드 로봇, 자율주행차, 스마트팩토리, 드론, 수술 로봇뿐 아니라 컴퓨터 화면을 보고 스스로 작업을 수행하는 소프트웨어 AI 에이전트에도 적용될 수 있다고 밝혔다. 인간의 직관적인 판단과 섬세한 제어가 필요한 피지컬 AI 시스템 전반에 활용 가능성이 있다는 것이다.

유창동 교수는 “피지컬 AI의 핵심은 기계가 인간의 의도를 이해하고 올바른 행동을 선택하도록 만드는 것”이라며 “VOTP는 소수의 영상만으로 인간의 판단 기준을 학습할 수 있어, 로봇이 사람처럼 판단하는 시대를 앞당길 핵심 기술”이라고 말했다.

이번 연구에는 KAIST 전기및전자공학부 Luu Minh Tung 박사과정 학생이 제1저자로 참여했다. 보도자료에 첨부된 연구자 사진에는 유창동 교수와 Luu Minh Tung 박사과정, 김환희 석사과정이 함께 소개됐다. 김환희 석사과정은 제2저자로 참여했다.

논문명은 ‘Video-Based Optimal Transport for Feedback-Efficient Offline Preference-Based Reinforcement Learning’이다. 연구 성과는 세계적 AI 학술대회인 ICML 2026에 구두 발표 논문으로 선정됐다. ICML은 인공지능과 머신러닝 분야의 주요 국제학회로 꼽히며, 이번 논문은 전체 제출 논문 중 상위 0.7%에 해당하는 구두 발표로 채택됐다.

이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원과 한국연구재단 등의 지원을 받아 수행됐다. 연구팀은 향후 관련 기업과의 산학협력을 통해 제조 공정과 서비스 로봇 분야에 이 기술을 시범 도입하고, 시각-언어-행동 모델과 같은 범용 로봇 인공지능 학습 수준을 높이는 방향으로 연구를 이어갈 계획이다.

이번 성과는 피지컬 AI가 인간의 의도를 학습하는 데 필요한 데이터 수집 부담을 줄이는 원천기술이라는 점에서 의미가 있다. 특히 말로 설명하기 어려운 로봇의 미세한 움직임 차이를 비디오 기반으로 평가하고, 이를 수학적 기법으로 확장해 학습하는 방식은 로봇과 자율주행, AI 에이전트 개발 과정에서 인간 피드백의 효율을 높이는 기반 기술로 활용될 수 있다.

#KAIST #유창동교수 #VOTP #피지컬AI #ICML2026

Social Share