The construction of lightweight High-definition (HD) maps containing geometric and semantic information is of foremost importance for the large-scale deployment of autonomous driving. To automatically generate such type of map from a set of images captured by a vehicle, most works formulate this mapping as a segmentation problem, which implies heavy post-processing to obtain the final vectorized representation. Alternative techniques have the ability to generate an HD map in an end-to-end manner but rely on computationally expensive auto-regressive models. To bring camera-based to an applicable level, we propose a fast end-to-end network generating a vectorized HD map via instance-level graph modeling of the map elements. Comprehensive experiments on nuScenes dataset show that our proposed network outperforms state-of-the-art methods by 13.7 mAP and achieves comparable accuracy with 5× faster inference speed.
기하학적 및 의미론적 정보를 포함하는 경량 정밀도로지도 구축은 자율주행의 대규모 구축을 위해서는 가장 중요한 요소이다. 차량으로부터 취득한 카메라 이미지 정보로부터 자동적으로 정밀도로지도를 생성하기 위해 많은 연구들은 이를 의미론적 분할론을 적용하는데, 이는 최종 벡터 형태의 맵을 생성하기 위해서는 많은 연산량이 요구되는 처리가 필요하다. 일부 연구에서는 종단 간 방식으로 정밀도로지도를 생성할 수 있지만 계산 비용이 많이 드는 자동 회귀 모델이 요구된다. 카메라 기반을 적용 가능한 수준으로 끌어올리기 위해 본 논문에서는 인스턴스 수준의 그래프 모델링을 통해 벡터화된 정밀도로지도를 생성하는 빠른 종단 간 네트워크를 제안한다. nuScenes 데이터셋에서 수행한 실험을 통해 제안하는 네트워크가 베이스라인보다 13.7mAP 더 뛰어난 성능을 보이고, 5배 빠른 추론 속도로 비슷한 정확도를 달성하는 것을 보인다.