The development of UAV has successfully replaced the missions that had been carried out by the human pilot, but no substitution has been made for the air combat mission. There is a growing demand for UAV to be applied to air-combat tasks, and research on autonomous air combat algorithms is required. Reinforcement learning that enables choosing optimal action in the current situation is sui표 for autonomous air-combat algorithms. In this paper, we focus on reinforcement learning based autonomous air combat algorithm based on reinforcement learning algorithms for air combat, position prediction of bandit reinforcement learning using combat-state.
무인기의 발전은 기존의 유인기에 의해 수행되던 임무를 성공적으로 대체하였지만 공중 교전 임무에 대해서는 대체가 이루어지지 않았다. 무인기의 공중 교전 임무 적용에 대한 요구는 증가하고 있고 이를 위한 자율 공중 교전 알고리즘에 대한 연구가 요구된다. 현재의 상황에서 최적의 기동을 수행할 수 있도록 하는 강화 학습은 자율 공중 교전 알고리즘에 적용하기 적합하다. 본 논문에서는 공중 교전을 위한 강화 학습알고리즘, 적기의 위치 예측, 전투 상태를 사용한 강화 학습 기반의 자율 공중 교전 알고리즘에 대한 연구를 다루고자 한다.