With the development of autonomous driving, the perception model in autonomous driving
is expected to work safely in various environments. Perception model that understands the
surrounding situation of autonomous vehicles is a deep learning model that learns from the
labeled sensor data obtained while driving. However, reaching global scalability requires a
countless number of data, and labeling the collected data is not only costly but also inefficient
due to redundant data. Accordingly, active learning research is actively underway to increase
data efficiency. Active learning is an efficient training method that alternates between training
and labeling. At the labeling stage, or selection stage, the trained model actively selects the
uncertain data to be labeled for the next training stage. However, when training an object
detection model using active learning, the dependence on initial training data is high because
the model must first detect the object to calculate the model’s uncertainty for that object. In
addition, in the case of 3D object detection compared to 2D object detection, there is a difficulty
in estimating the size in the depth direction since there are no points on the rear side of the
object. Finally, in the case of an autonomous driving dataset, due to class imbalance between
major and minor classes, such as cars and cyclists, the selection is biased towards a specific
class in the active learning stage. This study proposes an active learning technique applying
consistency-based semi-supervised learning. The proposed method maximizes the detection
performance by training the model using unlabeled data in the training stage. The data is
selected by further estimating the uncertainty of the box predictions and the class predictions.
Increased performance of the model due to semi-supervised learning increased object detection
rates, which reduced dependence on initial data. In addition, for datasets with a high class
imbalance, we found that selecting data by estimating the uncertainty of the bounding box was
more effective in the early active learning stage.
자율주행 기술이 발전함에 따라 전세계에서 동작하는 글로벌 확장성이 기대되고 있다. 자
율주행차의 주변 상황을 인지하는 인지기술은 딥러닝 기반의 인공지능 모델로, 주행중에 얻어진
센서 데이터를 라벨링하여 모델을 학습시킨다. 그러나 글로벌 확장성에 도달하기 위해서는 무수히
많은 데이터를 필요로 하며, 수집한 방대한 양의 데이터를 모두 라벨링 하는것은 비용도 많이 들
뿐 아니라 유사한 데이터를 중복해서 라벨링하게 되므로 효율성도 떨어지게 된다. 이에 모델을
사용하여 불확실한 데이터를 라벨링 하도록 선택하고, 선택된 데이터로 모델을 학습하는 과정을
번갈아 가면서 수행하는 능동학습 연구가 활발히 진행되고 있다. 그러나 자율주행의 인지기술인
객체 검출 모델을 능동학습으로 학습할 경우, 모델이 먼저 객체를 검출해야 해당 객체에 대한 모
델의 불확실성을 계산할 수 있기 때문에 초기 학습 데이터에 대한 의존도가 높다는 문제가 있다.
또한, 2D 객체 검출과 비교하여 3차원 객체 검출의 경우 어떤 센서를 사용하더라도 찍힌 물체의
뒷부분은 가려져 있기 때문에, 깊이 방향으로의 크기를 추정해야한다는 어려움이 존재한다. 마지
막으로, 자율주행 데이터셋의 경우 승용차의 수가 가장 많고, 오토바이 및 대형트럭 등 객체의 수가
적은 클래스 불균형이 어느정도는 존재하여 능동학습 단계에서 특정 클래스의 객체가 많이 뽑히는
문제가 발생하게 된다. 본 연구에서는 일관성 기반의 준지도 학습을 적용한 능동학습 기법을 제
안한다. 제안하는 방법은 학습 단계에서는 선택되지 않은 라벨이 없는 데이터를 학습에 사용하는
준지도 학습 방식으로 모델을 학습 시켜 모델의 검출 성능을 극대화 하였고, 데이터를 선택하는 단
계에서는 추정된 클래스의 불확실성 뿐 아니라 추정된 바운딩 박스의 불확실성을 추가로 추정하여
데이터를 선택하였다. 준지도 학습으로 인한 모델의 성능 증가로, 객체 검출율이 증가하여 초기
데이터에 대한 의존도를 낮출 수 있었을 뿐 아니라 활용 가능한 데이터를 모두 사용하여 데이터
효율을 증가시킨다. 추가로, 클래스 불균형이 높은 데이터셋의 경우 바운딩 박스의 불확실성을
추정하여 데이터를 선택하는 것이 초기 능동학습 단계에서 더 효과적임을 확인할 수 있었다.