서지주요정보
Backstepping temporal-difference learning = 백스테핑을 이용한 시간차 학습
서명 / 저자 Backstepping temporal-difference learning = 백스테핑을 이용한 시간차 학습 / HanDong Lim.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040792

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 23085

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Temporal-difference learning is one of the most widely used mode-free reinforcement learning algorithms. Even though its great success, its theoretical analysis is not well understood. We propose a new framework based on backstepping control, to understand the temproal-difference learning algortihms under linear function approximation. Moreover, we propose a new algorithm named Backstepping temporal-diffrence learning.

시간차 학습은 모델프리 강화학습 중 많이 사용되는 알고리즘 중 하나이다. 강화학습이 여러 분야에서 많은 성과를 보였지만 아직 이에 대한 이론적인 분석은 많이 되지 않았다. 이번 연구에서는 백스테핑이라는 제어 기법을 통해 선형 근사를 사용한 시간차 학습을 해석할 수 있는 프레임워크를 제시하고자 한다. 또한 이를 통해 백스테핑 시간차 학습이라는 새로운 알고리즘을 제시한다.

서지기타정보

서지기타정보
청구기호 {MEE 23085
형태사항 ii, 26 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 임한동
지도교수의 영문표기 : Donghwan Lee
지도교수의 한글표기 : 이동환
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 23-25
주제 Reinforcement learning
Control theory
Temporal-difference learning
강화학습
제어이론
시간차 학습
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서