Driving at an unsignalized intersection is a complicated driving scenario that requires both safety and traffic efficiency. In the intersection, the driving policy does not simply maintain the safe distance to all vehicles, but should pay more attention to the vehicles that are likely to cross with the ego vehicle and make its decision considering their intentions. Our goal is to train an attention-based driving policy for handling intersection scenarios using deep reinforcement learning. By leveraging the attention, our policy is able to learn how to focus on spatially and temporally more important features in its egocentric observation and perform complex driving strategies at the congested intersection environment.
We transfer the policy model trained in a high fidelity simulator to a full-scale vehicle system, and conduct experiments to evaluate our model in simulated and real-world environments. Our model successfully performs various intersection scenarios even with noisy sensory data and delayed response.
비보호 교차로에서 주행하는 것은 안전과 교통 효율성을 모두 요구하는 복잡한 운전 시나리오이다. 교차로에서 주행 정책은 단순히 모든 차량과의 안전 거리를 유지하는 것 뿐만이 아니라, Ego 차량과 교차 할 가능성이 높은 차량에 더 많은 주의를 기울이고 해당 차량의 의도를 고려하여 결정을 내려야한다. 본 논문의 목표는 심층 강화 학습을 사용하여 교차로 시나리오를 다루기 위한 Attention 기반 주행 정책을 학습하는 것이다. Attention을 활용함으로써 우리의 정책은 Egocentric observation에서 공간적 및 시간적으로 더 중요한 feature에 집중하고 혼잡 한 교차로 환경에서 복잡한 주행 전략을 수행하는 방법을 배울 수 있다.
우리는 현실적인 시뮬레이터에서 학습된 정책 모델을 실 환경 차량 시스템으로 transfer하고 시뮬레이션 및 실 환경에서 학습 모델을 평가하기위한 실험을 수행했다. 본 논문의 모델은 노이즈가 있는 sensory 데이터와 지연된 응답의 시스템에서도 다양한 교차 시나리오를 성공적으로 수행할 수 있었다.