Efficient data selection method for semi-supervised semantic segmentation = 준지도 학습 기반 의미론적 분할을 위한 효율적인 데이터 선택 방법
서명 / 저자 Efficient data selection method for semi-supervised semantic segmentation = 준지도 학습 기반 의미론적 분할을 위한 효율적인 데이터 선택 방법 / Inchul Chung.
발행사항 [대전 : 한국과학기술원, 2023].
Semantic segmentation, which provides dense information by classifying pixels into specific classes and accurately providing object boundaries in images, has gained significant attention in various fields such as autonomous driving and medical image processing. However, acquiring high-quality training data for this task can be time-consuming and expensive. To address this challenge, researchers have explored semi-supervised learning based approaches that utilize few labeled and large amounts of unlabeled data. Nevertheless, most existing methods randomly sample labeled data from the entire dataset, leading to significant variations in the performance of the trained models, particularly when labeled data is scarce. In this paper, we propose a solution to this problem by introducing an efficient data selection method for training semi-supervised semantic segmentation networks. Our method involves selecting the required labeled data from the overall dataset, leveraging the diversity within and across different images based on widely used pre-trained models. Notably, our approach does not require human interaction or additional training for data selection. We validate the effectiveness of our proposed method through experiments conducted on the Pascal VOC and Cityscapes datasets, using various semi-supervised semantic segmentation networks. The results show that our method achieves higher and more consistent performance compared to the random data selection method.

이미지의 의미론적 분할은 각 픽셀을 정해진 클래스로 분류해 이미지상 물체의 정확한 영역을 제공하는 등 밀도 높은 정보를 제공해 주어 자율주행, 의학 이미지 처리 등 다양한 분야에 활발히 사용되고 있다. 그러나 학습을 위한 양질의 데이터를 취득하는 과정은 시간적, 금전적 비용의 소모가 크기에, 일부의 라벨링 된 데이터와 다수의 라벨이 없는 데이터를 활용해 학습을 진행하는 준지도 학습 기반의 의미론적 분할 방법들이 연구되어 오고 있다. 그러나 대부분의 연구에서는 소수의 라벨링 된 데이터를 전체 데이터셋에서 무작위로 취득한 후 학습에 사용하여 샘플링된 데이터에 따라 학습 성능의 차이가 크며 이는 라벨링 된 데이터가 적을수록 두드러지게 나타난다는 문제점을 지니고 있다. 본 논문에서는 위 문제를 해결하고 효율적인 준지도 학습 기반 의미론적 분할 네트워크 학습을 위해 전체 데이터셋에서 라벨링이 필요한 데이터를 샘플링하는 방법을 제안한다. 널리 사용되는 사전 학습 모델들을 바탕으로 이미지 내의 그리고 이미지 간의 다양성을 파악하여 샘플링하는 방식을 고안하여 사람과의 상호 작용이나 추가적인 학습 없이 데이터 샘플링을 진행할 수 있다. Pascal VOC, Cityscapes 데이터셋과 다양한 준지도 학습 기반 의미론적 분할 네트워크를 활용한 실험에서 기존의 램덤 데이터 샘플링 방법에 비해 보다 높고 일정한 성능 달성하며 제안한 방법의 유효성을 입증하였다.


청구기호 {MME 23074
형태사항 v, 39 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정인철
지도교수의 영문표기 : Kuk-Jin Yoon
지도교수의 한글표기 : 윤국진
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 기계공학과,
서지주기 References : p. 33-35
주제 Semantic segmentation
Semi-supervised learning
Data selection
의미론적 분할
준지도 학습
데이터 선택





