서지주요정보
Training and exploration using agent relationship for multi-agent reinforcement learning = 다중 에이전트 강화학습을 위한 에이전트 관계를 이용한 훈련 및 탐색
서명 / 저자 Training and exploration using agent relationship for multi-agent reinforcement learning = 다중 에이전트 강화학습을 위한 에이전트 관계를 이용한 훈련 및 탐색 / Heechang Ryu.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8037512

소장위치/청구기호

학술문화관(문화관) 보존서고

DIE 21006

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Multi-agent reinforcement learning (MARL) is a type of machine learning technique that decentralizes and controls a complex system composed of several sub-systems, and it is attracting much attention with recent advances in reinforcement learning and deep learning. Controlling such a multi-agent system aims for agents to complete a collaborative task. Thus, the consensus of decentralized and controlled agents by MARL is essential to complete the task in the system. In this dissertation, we propose various MARL methods to consider the relationship among agents in terms of model, exploration, and training to achieve consensus among agents. In particular, the proposed methods learn the dynamic relations that can change which agent to focus on depending on the situation. By making MARL learn better the relations, we empirically demonstrate that the proposed methods outperform existing methods and provide an empirical analysis of why the proposed methods work.

다중 에이전트 강화학습은 여러 하위 시스템으로 구성된 복잡한 시스템을 분산화하여 제어하는 기계학습 기법으로, 최근 강화학습과 심층학습의 발전과 함께 크게 주목을 받고 있다. 이러한 다중 에이전트 시스템을 제어하는 것은 에이전트들이 공동의 과제를 완수하는 것을 목적으로 한다. 따라서, 그 시스템에서 과제를 완수하기 위해, 다중 에이전트 강화학습으로 분산화 제어된 에이전트들의 합의가 필수적이다. 본 학위 논문에서는 에이전트들의 합의를 이루기 위해 모델, 탐색 및 훈련 측면에서 에이전트들 간의 관계를 고려한 다양한 다중 에이전트 강화학습 방법을 제안한다. 특히, 제안된 방법들은 상황별로 집중하는 에이전트가 변할 수 있는 동적인 관계를 학습한다. 우리는 제안된 방법들을 통하여 다중 에이전트 강화학습이 에이전트들 간의 관계를 더 잘 학습하도록 함으로써, 기존 방법들의 성능을 능가함을 실험적으로 입증하고, 제안된 방법들이 작동하는 이유에 대한 실험적 분석을 제시한다.

서지기타정보

서지기타정보
청구기호 {DIE 21006
형태사항 iv, 55 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 류희창
지도교수의 영문표기 : Hayong Shin
지도교수의 한글표기 : 신하용
공동지도교수의 영문표기 : Jinkyoo Park
공동지도교수의 한글표기 : 박진규
학위논문 학위논문(박사) - 한국과학기술원 : 산업및시스템공학과,
서지주기 References : p. 49-53
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서