The method of determining the algorithm to control the unmanned autonomous vehicle was gradually achieved through a learning - based approach in the existing rule - based system. As the road traffic ratio of autonomous vehicles increases, there is an advantage in reducing the accident rate, improving fuel economy, and reducing congestion. In the weaving section, the interactions between the vehicles due to the lane change of the vehicle frequently occur, so that the process of making decisions based on interests is very complicated. In order to learn the autonomous driving model, labeled big data is essential. In this study, the vehicle driving simulator is produced to continuously generate data necessary for learning. We study the deep reinforcement learning algorithm that controls the vehicle through the generated data, and evaluate the traffic engineering performance in the weaving section.
무인 자율주행 차량을 제어하는 알고리즘을 결정하는 방식은, 기존 룰 기반 시스템에서 점차 러닝 기반의 방식의 접근을 통해 이루어졌다. 자율 주행 차량의 도로 통행 비율이 높아질수록, 사고율 감소, 연비 향상, 정체 감소 등의 이점이 있다. weaving 구간에서는, 차량의 차선 변경으로 인한 차량 간의 상호작용이 빈번하게 일어나므로, 이해 관계를 고려하여 의사결정을 내리는 프로세스가 매우 복잡하다. 한편 자율주행 모델을 학습하기 위해서는 라벨링 된 빅데이터가 필수적인데, 본 연구에서는 차량 주행 시뮬레이터를 제작하여 학습에 필요한 데이터를 지속적으로 생성할 수 있도록 한다. 생성된 데이터를 통해 차량을 제어하는 딥 강화학습 알고리즘을 학습하고, weaving 구간에서의 교통 공학적 성능을 평가한다.