소프트맥스 기반 노이즈 필터링을 통한 랜덤 지우기 증대 성능개선 = Improving random erasing augmentation performance with noise filtering using softmax confidence
서명 / 저자 소프트맥스 기반 노이즈 필터링을 통한 랜덤 지우기 증대 성능개선 = Improving random erasing augmentation performance with noise filtering using softmax confidence / 박재용.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄





학술문화관(문화관) 보존서고

MKSE 20011

휴대폰 전송







The random erasing augmentation technique presented in 2017 was introduced to enhance the detection capability of the occluded image data. While most of the training data are not occluded, many of the test data in real world are occluded by another object. This phenomenon reduces the performance of image classification or object detection. As a solution to this, random erasing augmentation techniques artificially block some areas of training data by filling them with boxes of random size. This augmentation technique has resulted in increased accuracy of object classification and detection capabilities not only in the occluded data but also in the general data. However, in the process of randomly erasing image data, most of object area could be inevitably erased. These data will be noise that will adversely affect the model because it will lose the main properties of the object. In this paper, a method is proposed to increase the performance of the model by eliminating these noise. At first, the original data create CNN models and augmentation data using random erasing. Then, the model is used to determine the softmax confidence of the augmentation data. If the augmentation data retains the characteristics of the original data, the softmax value will be close to one, and if the original data has lost much of their characteristics, it will be close to zero. Data close to zero will probably be noise and it will be deleted. CNN model performance can be further improved when only high-quality augmentation data is used for model training.

2017년 제시된 랜덤 지우기 증대기법은 폐색된 이미지 데이터의 탐지능력을 높이기 위해서 등장한 기법이다. 폐색이란 객체의 일부분이 다른 물체에 의해서 가려져 보이지 않는 것을 말하는데 일상적으로 사용되어지는 훈련데이터들은 형태가 온전히 유지되는 것을 사용하는 데 반해, 현실에서 탐지해야 하는 데이터들은 폐색된 형태의 것들이 많다. 이에 대한 해결책으로, 랜덤 지우기 증대기법은 훈련데이터의 일부 영역을 랜덤한 크기의 박스로 채워 인위적으로 폐색시킨다. 이와 같은 방법으로 데이터를 증대시켜 CNN 모델을 생성한 결과, 폐색 데이터 뿐만 아니라 일반 데이터에서도 객체 분류 및 탐지능력이 향상되는 것으로 나타났다. 그러나, 랜덤하게 이미지 데이터를 지우는 과정에서 객체의 주요부분이 지워지는 현상이 발생할 수 밖에 없다. 이렇게 지워진 데이터들은 객체의 주요특성을 상실하기 때문에 모델에 나쁜 영향을 미치는 노이즈가 될 것이다. 본 논문에서는 이러한 노이즈를 제거하여 모델의 성능을 높이는 방법을 제안한다. 제안된 방법은, 원본 데이터를 사용해 CNN 모델과 증대 데이터를 만들고, 만들어진 모델을 사용해서 증대 데이터들의 소프트맥스 확률을 확인하는 것이다. 증대 데이터가 원본 데이터의 특성을 유지한다면 소프트맥스 값은 1에 가까운 값이 나올 것이고, 원본 데이터의 특성을 많이 잃어 버렸다면 0에 가까운 값이 나올 것이다. 0에 가까운 데이터는 노이즈일 것임으로 제거한다. 이와 같은 방법을 통해 노이즈는 제거하고 양질의 증대 데이터만 사용해서 모델 훈련시, 랜덤 지우기 증대 기법보다 약 3배 가량 정확도가 향상되었다.


청구기호 {MKSE 20011
형태사항 iii, 34 p. : 삽화 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Jaeyong Park
지도교수의 한글표기 : 이문용
지도교수의 영문표기 : Mun Yong Yi,
학위논문 학위논문(석사) - 한국과학기술원 : 지식서비스공학대학원,
서지주기 참고문헌 수록.





이 주제의 인기대출도서