In recent years, research for robot control has developed rapidly, multi-agent robotics, multi-agent-UAV and drone swarm are also popular. Path planning is already researched in both single and multi-agent environment, however a surveillance mission is different from maze problem, which has a specific start point and a goal point, and it is intractable to solve with simple path planning algorithm. Artificial intelligence is commonly used to solve the problem which is very tricky to formulate and the model is made to approximate solution with high accuracy, especially reinforcement learning is used to determine agents’ action with given situation. In this research, reinforcement learning model is used to find an efficient and robust solution of surveillance, and design simulation and show results for model verification.
최근 무인기, 로봇 운용에 대한 연구가 활발히 이루어지면서 다중 에이전트, 다중 무인기, 드론 군집 등에 관한 연구가 활발하다. 경로 계획법은 이미 단일 에이전트와 다중 에이전트 연구 일부가 수행되었으나 미로 문제와 같이 출발점과 도착점이 정해진 문제와는 달리 정찰 임무는 정찰 요구 지역을 한번 이상 정찰하는 것을 목표로 하며 효과적인 경로를 찾기 위해서는 단순한 경로 계획법으로 풀기 매우 어렵다. 인공지능 기법은 이전부터 수식으로 해결하기 어려운 많은 문제를 학습을 통하여 높은 정확도로 정답을 찾는 것을 목표로 하였으며, 강화학습 기법은 다중 타임스텝에서 주어진 상황에 대한 행동을 판단하도록 학습을 한다. 본 연구에서는 강건하고 효율적인 지역 정찰 방법을 찾기 위하여 인공지능 기법 중 하나인 강화학습 모델을 설계하고, 모델 검증을 위한 시뮬레이션 설계 및 결과를 제시하였다.