This study deals with the algorithm that searches optimal data augmentation policies which can improve the performance of the machine learning algorithm in vision related tasks. Data augmentation solves the data shortage in machine learning algorithm and induces robust training in image process problems resulting in the improved generalization of target tasks. Recently, human-designed data augmentation has been replaced by automatically the searched augmentation policy in the pre-defined search space of data augmentation.
AutoAugment can significantly improve the accuracy of the image classification tasks by searching the optimal augmentation policy for the dataset with reinforcement learning (RL). In previous studies, however, the same augmentation policy is applied throughout the entire dataset so that every data in the dataset is pre-processed with the same augmentation policy. In this study, the augmentation policy search method for individual data, Adaptive AutoAugment, has been proposed. Adaptive AutoAugment has applied different augmentation policy throughout learning progress even with the same data, while consuming the least computational resources. It has improved the performance of image classification on CIFAR-10/100 with the 2.5 times fewer computational resources than the most efficient method.
이 연구는 이미지 분류 문제에서 딥뉴럴 네트워크의 최종 성능을 높이기 위해 최적의 데이터 증강 기법을 탐색하는 알고리즘을 다루고 있다. 데이터 증강은 기계학습 알고리즘의 학습 데이터 부족 문제를 개선하고 노이즈에 덜 민감한 학습을 하여 일반화를 개선한다. 최근에는 인간이 직접 설정한 데이터 증강 기법이 아닌, 특정 탐색 공간 안에서 자동으로 찾아낸 데이터 증강을 사용하고 있다. AutoAugment는 강화 학습을 이용해 최선의 데이터 증강을 탐색하여 이미지 분류 문제에서 상당한 정확도 개선을 이루었다. 하지만 기존 연구는 데이터셋 전체에 공통적으로 적용할 하나의 고정된 데이터 증강 기법을 찾아 모든 데이터가 같은 방식의 전처리를 거치도록 한다. 본 연구에서는 전체 데이터셋에 대해 하나의 데이터 증강을 탐색하지 않고 각 데이터 마다 최적화된 데이터 증강 기법을 탐색하는 알고리즘인 적응형 자동 데이터 증강을 제시했다. 적응형 자동 데이터 증강은 같은 데이터라도 학습 진행에 따라 다른 데이터 증강을 적용하였고 동시에 가장 적은 계산 자원을 소모했다. 제안된 방법은 CIFAR-10/100 데이터에서 가장 효율적인 기법보다 2.5배 적은 계산 자원으로 최적화된 데이터 증강 기법을 찾았으며 이미지 분류 정확도를 개선하였다.