This study proposes an efficient solution for autonomous flight for aerial robots in complex environments by introducing MAT-CMPC-based global/local planning and reinforcement learning (RL)-based reactive obstacle avoidance. The framework integrates three key components. First, a Medial Axis Transformation (MAT)-based Safe Flight Corridor (SFC) defines safe zones by generating sequential spherical volumes, ensuring safe navigation through global planning. Second, the MAT-Convex Model Predictive Control (CMPC) formulation optimizes local trajectories, ensuring smooth and collision-free navigation. Third, the RL-based reactive obstacle avoidance method enables real-time handling of unforeseen obstacles through quick and reactive control. Simulations demonstrated that the MAT-CMPC framework efficiently navigates complex environments, outperforming existing methods in computation time, trajectory length, and flight duration. Additionally, the RL-based reactive obstacle avoidance method showed adaptability to various obstacle environments, forward velocities, and local planner configurations. Real-world experiments further confirmed the computational efficiency and practical applicability of the RL-based reactive obstacle avoidance method using a multirotor equipped with an onboard computer.
본 연구는 중심축 변환 컨벡스 모델 예측 제어 기반 전역/지역 계획과 강화학습 기반 반응형 장애물 회피를 도입하여 복잡한 환경에서 자율 비행을 위한 효율적인 솔루션을 제안한다. 이 프레임워크는 세 가지 주요 구성 요소를 통합한다. 첫째, 중심축 변환 기반 안전 비행 통로는 연속적인 구체 공간을 생성하여 안전 구역을 정의함으로써 전역 계획을 통해 안전한 이동을 보장한다. 둘째, 중심축 변환 기반 컨벡스 모델 예측 제어는 지역 경로를 최적화하여 매끄럽고 충돌 없는 비행을 가능하게 한다. 셋째, 강화학습 기반 반응형 장애물 회피 기법은 빠르고 반응적인 기동을 통해 예기치 못한 장애물을 실시간으로 회피할 수 있도록 한다. 시뮬레이션에서는 중심축 변환 컨벡스 모델 예측 제어 프레임워크가 복잡한 환경에서 효율적으로 경로를 계획하며, 계산 시간, 경로 길이, 비행 시간 측면에서 기존 방법보다 우수한 성능을 보임을 입증했다. 또한, 강화학습 기반 반응형 장애물 회피 기법은 다양한 장애물 환경, 전진 속도, 지역 계획 설정에 효과적으로 적응하는 능력을 보여주었다. 실제 실험에서는 탑재 컴퓨터를 장착한 멀티로터를 사용해 강화학습 기반 반응형 장애물 회피 기법의 계산 효율성과 실용 가능성을 추가적으로 확인했다.