With the development of AI technology and deep reinforcement learning, applied research in various fields is making great achievements, and recently it has been extended to the problem of multi-agent reinforcement learning. Due to the increase of battlefield information with the introduction of the C4ISR system, it is necessary to introduce an AI staff to help make tactical decisions quickly and accurately by applying this technological development to the military decision-making field, but development of algorithms to help tactical decision-making was somewhat limited due to the absence of definition of problem and an existing learning environment. Therefore, this study defined the tactical decision-making problem as a multi-agent reinforcement learning problem and tried to solve it by proposing a new learning environment that developed the previously widely used multi-agent reinforcement learning environment. Through this, a problem that cannot be solved by the existing multi-agent reinforcement learning algorithm was presented, and on the other hand, the possibility of agent learning that behaves similarly to the military doctrine was discovered.
AI기술과 심층강화학습의 발전에 따라 다양한 분야의 응용연구들이 많은 성과를 거두고 있으며, 최근에는 다중에이전트 강화학습 문제로 확장되고 있다. 전장관리체계의 도입과 함께 증가한 전장정보로 인해 이러한 기술발전을 군 의사결정 분야에도 적용하여 신속하고 정확하게 전술적 의사결정을 내리도록 도와주는 AI참모 도입이 필요한 상황이나, 문제의 정의와 이를 시뮬레이션 할 수 있는 학습 환경의 부재로 전술적인 의사결정을 돕는 알고리즘 개발에는 다소 제한이 있었다. 따라서 본 연구는 전술적 의사결정 문제를 다중에이전트 강화학습 문제로 정의하고 기존에 널리 사용된 다중에이전트 강화학습 환경을 발전시킨 새로운 학습환경을 제안하여 이를 해결하고자 하였다. 이를 통해 기존 다중에이전트 강화학습 알고리즘으로 풀리지 않는 문제를 제시하였으며, 한편으로는 군사 교리과 유사하게 행동하는 에이전트 학습의 가능성을 발견하였다.