한국과학기술원 도서관

서지주요정보
Backstepping temporal-difference learning = 백스테핑을 이용한 시간차 학습
서명 / 저자	Backstepping temporal-difference learning = 백스테핑을 이용한 시간차 학습 / HanDong Lim.
발행사항	[대전 : 한국과학기술원, 2023].
Online Access	원문보기 원문인쇄

소장정보

등록번호

8040792

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 23085

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Temporal-difference learning is one of the most widely used mode-free reinforcement learning algorithms. Even though its great success, its theoretical analysis is not well understood. We propose a new framework based on backstepping control, to understand the temproal-difference learning algortihms under linear function approximation. Moreover, we propose a new algorithm named Backstepping temporal-diffrence learning.

시간차 학습은 모델프리 강화학습 중 많이 사용되는 알고리즘 중 하나이다. 강화학습이 여러 분야에서 많은 성과를 보였지만 아직 이에 대한 이론적인 분석은 많이 되지 않았다. 이번 연구에서는 백스테핑이라는 제어 기법을 통해 선형 근사를 사용한 시간차 학습을 해석할 수 있는 프레임워크를 제시하고자 한다. 또한 이를 통해 백스테핑 시간차 학습이라는 새로운 알고리즘을 제시한다.

서지기타정보

서지기타정보
청구기호	{MEE 23085
형태사항	ii, 26 p. : 삽도 ; 30 cm
언어	영어
일반주기	저자명의 한글표기 : 임한동 지도교수의 영문표기 : Donghwan Lee 지도교수의 한글표기 : 이동환 Including appendix
학위논문	학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기	References : p. 23-25
주제	Reinforcement learning Control theory Temporal-difference learning 강화학습 제어이론 시간차 학습

QR CODE

책소개

전체보기

나의 도서관정보

메뉴

소장정보

리뷰정보

초록정보

서지기타정보

책소개

목차

이 주제의 인기대출도서