The collision avoidance function of the hobby drone currently on the market uses several sensors to
determine the distance to an object and avoids it, so the collision avoidance performance in a complex
environment is low. This study applied deep reinforcement learning to study a collision-avoidance system
with higher performance than the current performance. Objects were recognized using a depth camera
in front and a 2D LiDAR. The collision avoidance baseline code of a heuristic algorithm was written.
The control model was trained by compensating for positive values when it follows a baseline, is fast, and
there is no collision. As a result of comparing the learned collision avoidance system with the baseline,
the collision avoidance success rate was the same or higher in various situations(include in the complex
environment). The average obstacle passing speed was also higher than the baseline. In addition, when
the learning model was applied to a real drone and tested in a real environment, the result of avoiding
obstacles was obtained. Through this study, we developed a collision-avoidance system for drones that
operate in reality as well as in simulation.
현재 취미 드론의 충돌 회피 기능은 여러 센서를 이용하여 물체와의 거리를 판단하고 단순히 피하는 정도의
성능으로 실내나 복잡한 환경에서의 충돌 회피성능이 낮다. 본 연구에서는 심층 강화학습을 적용하여 높은
성능을 가지는 충돌 회피 시스템을 연구하였다. 전방의 깊이 카메라와 2차원 라이다를 사용하여 물체를
인지하였다. 학습을 위해 휴리스틱 한 알고리즘의 충돌 회피 베이스라인 코드를 작성하여, 베이스라인을
모방하면서 높은 속도와 충돌하지 않았을 때의 양수 값의 보상을 통해 제어모델을 학습하였다. 학습된 충
돌 회피 시스템을 베이스라인과 비교해본 결과 다양한 상황에서 충돌 회피 성공률이 같거나 높게 나왔고
평균 장애물 통과속도 또한 베이스라인보다 높은 결과를 보였다. 또한, 학습모델을 실제 드론에 적용하여
실제 환경에서 시험하였을 때 시뮬레이션과 같이 장애물들을 잘 회피하는 결과를 얻었다. 본 연구를 통해
시뮬레이션뿐만 아니라 실제에서도 동작하는 드론의 충돌 회피 시스템을 개발하였다.