This thesis, investigates the application of diffusion models to improve the perception systems of autonomous vehicles. Leveraging semantic segmentation, we utilize bird's eye view mapping as a novel perspective for more robust environment comprehension. With a specific focus on the widely recognized NuScenes dataset, the research methodically unpacks the process of image segmentation, the propagation of error through the model, and the subsequent impacts on system comprehension and prediction. Emphasis is placed on the potential enhancements offered by diffusion models, as they allow for better uncertainty quantification, a key aspect in safety-critical applications such as autonomous driving. While the results achieved did not surpass the current state-of-the-art (SOTA) models, they provide critical insights into the nature and potential improvements in the handling of segmentation tasks for autonomous vehicles. The insights and learnings from this study will contribute significantly to future research aiming to refine and optimize perception models for autonomous driving.
이 논문, "자율 주행 차량 인식을 위한 Bird's Eye View Mapping에서 의미론적 세분화를 위한 확산 모델 탐색"은 확산 모델의 적용을 통해 자율 주행 차량의 인식 시스템을 개선하는 것을 조사합니다. 의미론적 세분화를 활용하여 보다 견고한 환경 이해를 위한 새로운 관점으로서 bird's eye view mapping을 사용합니다. 널리 인정받는 NuScenes 데이터셋에 특별히 초점을 맞춘 연구는 이미지 세분화 과정, 모델을 통한 오류의 전파, 그리고 시스템 이해와 예측에 미치는 후속 영향을 체계적으로 분석합니다. 확산 모델이 더 나은 불확실성 정량화를 가능하게 함으로써, 자율 주행과 같은 안전 중심의 응용에서 중요한 부분을 강조하였습니다. 달성된 결과는 현재의 최첨단 모델을 초과하지는 못했지만, 자율 주행 차량의 세분화 작업 처리에 대한 특성과 잠재적 개선점에 대한 중요한 통찰력을 제공합니다. 이 연구에서 얻은 통찰력과 배움은 자율 주행 인식 모델을 정제하고 최적화하려는 미래의 연구에 크게 기여할 것입니다.