Collision Avoidance/Mitigation System (CAMS) for autonomous vehicles is a crucial technology that ensures the safety and reliability of autonomous driving systems. Conventional collision avoidance approaches avoid collisions based on rules for specific collision scenarios. Such collision avoidance systems exhibit limited performance in complex and various collision scenarios because they depend highly on predetermined rules and decision algorithms. This has led to recent research exploring learning-based methods using neural networks for more adaptable collision avoidance. However, the approaches that directly output control inputs through neural networks have significant drawbacks in terms of interpretability and stability, which in turn hinder the practical application of learning-based collision avoidance methods in the real world. To address these limitations, we propose a trajectory planning method for CAMS that combines deep reinforcement learning (DRL) and quintic polynomial (QP) trajectory planning. The proposed method determines the terminal state and confidence of the trajectory using DRL and plans a QP trajectory based on them. By utilizing the terminal state and confidence of the trajectory rather than direct control inputs as the output of the neural network, it generates a more realistic and continuous path. Moreover, this approach considers collision avoidance and mitigation in an integrated manner through the reward function of RL. Our experimental results demonstrate that the proposed method not only improves interpretability and stability compared to existing learning-based methods but also upholds performance in complex and various collision scenarios. The proposed algorithm is expected to contribute to reducing traffic fatality by ensuring the safety and reliability of autonomous vehicles.
자율주행 차량의 충돌 회피 및 경감 시스템은 자율주행 시스템의 안전성과 신뢰성을 확보하는 중요한 기술이다. 기존 자율주행 차량의 충돌 회피 방법들은 특정 시나리오에 대해 미리 정해진 대응 방법을 통해 충돌을 회피한다. 이러한 특정 시나리오에 특화된 충돌 회피 방식은 사전에 설정된 규칙과 판단 알고리즘에 크게 의존하기 때문에 복잡하고 다양한 충돌 상황에서는 제한적인 성능을 보일 수 있다. 이로 인해 최근에는 복잡하고 다양한 충돌 상황에 대응 가능한 학습 기반 충돌 회피 방법에 대한 연구가 활발하게 진행되고 있다. 하지만 신경망의 출력으로써 차량의 제어 입력을 직접적으로 출력하는 방식은 자율주행 시스템의 해석 가능성과 안정성의 측면에서 큰 문제를 안고 있으며, 이러한 측면은 학습 기반 충돌 회피 방법의 현실에서의 활용을 어렵게 하고 있다. 본 연구에서는 이러한 문제들을 해결하기 위해 심층 강화학습과 5차 다항식 경로 계획 방법을 결합한 충돌 회피 및 경감 시스템을 위한 경로 계획 방법을 제안한다. 제안하는 방법은 심층 강화학습을 통해 5차 다항식 경로의 종단 상태와 신뢰도를 결정하고, 심층 강화학습의 출력을 기반으로 5차 다항식 경로 및 속도 프로파일을 계획한다. 신경망의 출력으로 직접적인 제어 입력이 아닌 경로의 종단 상태와 신뢰도를 사용함으로써 보다 현실적이고 연속적인 경로를 생성한다. 또한, 이 방법은 강화학습의 보상 함수를 통해 충돌 회피와 경감을 통합적으로 고려한다. 우리의 실험 결과는 제안한 방법이 기존 학습 기반 방법에 비해 해석 가능성과 안정성을 향상시킬 뿐만 아니라 복잡하고 다양한 충돌 시나리오에서도 성능을 유지함을 보여준다. 이 연구를 통해 자율주행 차량의 안전성과 신뢰성을 확보함으로써 교통사고로 인한 사망자 수 감소에 기여할 것으로 기대한다.