Imitation learning from model predictive control for dynamic motions of quadruped = 사족 보행 로봇의 역동적인 운동을 위한 모델예측제어의 모방학습
서명 / 저자 Imitation learning from model predictive control for dynamic motions of quadruped = 사족 보행 로봇의 역동적인 운동을 위한 모델예측제어의 모방학습 / Yong Hoon Lee.
발행사항 [대전 : 한국과학기술원, 2024].
Model Predictive Control(MPC), which computes control inputs to minimize a given cost function, has demonstrated high performance in various studies related to quadrupedal robots. However, the computation time needs to be shorter than the control period for real-time implementation of MPC. Therefore, applying high control frequency or long prediction horizons to MPC is limited. Research that utilizes imitation learning to replace MPC with an artificial neural network of comparable performance has been conducted to reduce computation time significantly. However, existing research has been applied to the walking motion of quadrupedal robots, where real-time control of MPC is possible without the need for high control frequency or long prediction horizons. This paper proposes imitation learning for MPC to implement various dynamic motions of a quadrupedal robot. In particular, by solving the problem of computation time through imitation learning, high performance resulting from the short control cycle and long prediction horizon of model predictive control can be achieved in real-time control. The motions implemented include jumping over obstacles while running with a bounding gait, jumping off a roof, etc. These motions are implemented with a single neural network.

모델예측제어는 주어진 비용함수를 최소화하는 제어 입력을 구하며 이를 사족 보행 로봇에 적용한 여러 연구에서 높은 성능을 보였다. 하지만 실시간으로 모델예측제어를 하기 위해서는 계산 시간이 제어 주기보다 짧아야 하므로 모델예측제어에 짧은 제어 주기나 긴 prediction horizon을 적용하는데 한계가 있다. 이러한 문제를 해결하기 위해 모델예측제어를 같은 성능의 인공신경망으로 대체하여 계산시간을 크게 줄이는 모방학습을 활용하는 연구들이 있다. 그러나 이는 사족 보행 로봇의 걷는 운동에 대한 것으로 모델예측제어에서 짧은 제어 주기나 긴 prediction horizon이 필요 없어 이미 모델예측제어의 실시간 제어가 잘 되는 경우이다. 본 논문에서는 사족 보행 로봇의 다양한 역동적인 운동을 구현하기 위한 모델예측제어의 모방학습을 제안한다. 특히, 모방학습으로 계산 시간의 문제를 해결하여 모델예측제어의 짧은 제어 주기와 긴 prediction horizon에서 나오는 높은 성능을 실시간 제어에서 얻을 수 있도록 한다. 구현한 운동에는 bounding gait로 달리다가 장애물을 뛰어넘는 것, 높은 단차에서 뛰어내리고 착지하는 것 등이 있으며 이를 단일 인공신경망으로 구현하였다.


청구기호 {MME 24044
형태사항 ii, 27 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이용훈
지도교수의 영문표기 : Hae-Won Park
지도교수의 한글표기 : 박해원
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 기계공학과,
서지주기 References : p. 24-25
주제 Model Predictive Control
Imitation Learning
Quadrupedal Robot
Real-Time Control
Neural Network
사족 보행 로봇
실시간 제어





