서지주요정보
모델예측제어 모방학습과 강화학습을 보행 로봇에 적용한 연구 = Reinforcement learning with imitation learning from the MPC: application to legged robots
서명 / 저자 모델예측제어 모방학습과 강화학습을 보행 로봇에 적용한 연구 = Reinforcement learning with imitation learning from the MPC: application to legged robots / 염동훈.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039018

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MME 22032

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recently, there has been model-based control as a method widely used to control legged robots. Model-based control controls the legged robot through a dynamic equation including each element's mass and inertia. In particular, a method attracting attention among model-based control is a model predictive control method. The model predictive control method obtains a control input through optimization by predicting the movement of a model for a horizon so that a specified cost function is minimized. Since the model predictive control method has to solve the optimization problem for each control cycle, the more complex the problem to be, the faster the control cycle cannot be. Therefore, recently, efforts have been made to replace model predictive control with neural networks through imitation learning. This paper proposes a more sample-efficient and performance-friendly method by combining two existing imitation learning methods. Next, reinforcement learning starts with neural networks that replace the model predictive controller of legged robots, learn with small samples, and suggest ways to increase the control cycle.

최근 보행 로봇의 제어에 많이 사용되는 방법으로 모델기반제어가 있다. 모델기반제어의 경우 보행 로봇의 각 요소의 질량과 관성모멘트가 포함된 동역학 식을 통하여 제어하는 방법이다. 특히 모델기반 제어 중에서도 주목받고 있는 방법이 모델예측제어 방법이다. 모델예측제어 방법은 지정한 비용함수가 최소화되도록 일정 구간 동안의 모델의 움직임을 예측하여 최적화를 통해 제어입력을 구하는 방법이다. 모델예측제어 방법의 경우 제어주기마다 최적화 문제를 풀어야 하므로 풀고자 하는 문제가 어려울수록 제어주기를 빠르게 할 수 없다. 따라서 최근 모방학습을 통해 모델예측제어를 신경망으로 대체하고자 하는 노력이 이루어졌다. 본 논문은 기존에 사용되는 모방학습 방법 중 2가지를 결합해 더욱 표본 효율적이고 성능이 좋은 방법을 제시한다. 다음으로 이를 통해 보행 로봇의 모델예측제어기를 대체하는 신경망으로부터 강화학습을 시작해 적은 표본으로도 학습하며 제어주기를 높일 방법을 제시한다.

서지기타정보

서지기타정보
청구기호 {MME 22032
형태사항 iv, 32 p. : 삽화 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Donghoon Youm
지도교수의 한글표기 : 박해원
지도교수의 영문표기 : Hae-Won Park
공동지도교수의 한글표기 : 황보제민
공동지도교수의 영문표기 : Jemin Hwangbo
부록 수록
학위논문 학위논문(석사) - 한국과학기술원 : 기계공학과,
서지주기 참고문헌 : p. 30-31
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서