We consider the problem of cooperative multi-agent reinforcement learning in partially observable environment. In particular, it is essential to coordinate between agents in partially observable environment. In this paper, we introduce the compressed feature vectors for communicate between agents and how to design the decentralized network using them. We also introduce and apply the group dropout layer to train the ensemble of sub-network efficiently, and evaluate the proposed network on pursuit, which is a standard task in multi-agent systems.
우리는 부분적 관찰 가능한 환경에서 협력 다중 에이전트 강화 학습 문제를 고려한다. 특히 부분적 관찰 가능한 환경에서는 에이전트간의 협력이 필수적이다. 본 논문에서는 에이전트 간에 통신을 하기위한 축약된 특징 벡터들과, 그것들을 이용해 어떻게 분산적 네트워크를 디자인 할 것인가를 소개할 것이다. 또한 에이전트의 서브 네트워크의 앙상블을 학습하기 위해서 그룹 드롭아웃 레이어를 소개 및 적용하고, 제안된 네트워크들을 다중 에이전트 시스템의 표준적인 환경인 펄수잇을 통해 평가할 것이다.