서지주요정보
Distributed dynamic programming and reinforcement learning from a control system perspective = 제어 시스템 관점에서의 분산 동적 프로그래밍 및 강화학습
서명 / 저자 Distributed dynamic programming and reinforcement learning from a control system perspective = 제어 시스템 관점에서의 분산 동적 프로그래밍 및 강화학습 / Okyong Choi.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039753

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MRE 22011

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

We investigate distributed dynamic programming (DP) and reinforcement learning (RL) to solve networked multi-agent Markov decision problems (MDPs). We consider a distributed multi-agent case, where each agent does not have an access to the rewards of other agents except for its own reward. Moreover, each agent can share their parameters with its neighbors over a communication network represented by a graph. We propose a distributed DP in the continuous-time domain, and prove its convergence through control theoretic viewpoints. The proposed analysis can be viewed as a preliminary ordinary differential equation (ODE) analysis of a distributed temporal difference (TD) learning algorithm, whose convergence can be proved using Borkar-Meyn theorem and the single time-scale approach. Finally, We extend the DP to the corresponding TD learning.

네트워크화된 다중 에이전트 마르코스 결정 프로세스을 해결하기 위해 분산 동적 프로그래밍과 강화 학습을 조사한다. 우리는 각 에이전트가 자체 보상을 제외하고 다른 에이전트의 보상에 액세스할 수 없는 분산 다중 에이전트 사례를 고려한다. 또한 각 에이전트는 그래프로 표시되는 통신 네트워크를 통해 자신의 매개 변수를 이웃과 공유할 수 있다. 우리는 연속 시간 영역에서 분산 다이나믹 프로그래밍을 제안하고 제어 이론적 관점을 통해 수렴을 증명한다. 제안된 분석은 분산 시간차 학습 알고리듬의 예비 상미분 방정식 분석으로 볼 수 있으며, 이 알고리듬의 수렴은 Borkar-Meyn 정리와 단일 시간 척도 접근법을 사용하여 증명될 수 있으므로 다이나믹 프로그래밍이 해당 시간차 학습으로 확장될 수 있다.

서지기타정보

서지기타정보
청구기호 {MRE 22011
형태사항 ii, 24 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 최옥용
지도교수의 영문표기 : Donghwan Lee
지도교수의 한글표기 : 이동환
학위논문 학위논문(석사) - 한국과학기술원 : 로봇공학학제전공,
서지주기 References : p. 20-22
주제 Dynamic programming,
Markov decision processes
multi-agent systems
consensus
reinforcement learning
동적 프로그래밍
마르코프 결정 프로세스
다중 에이전트 시스템
합의
강화 학습
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서