Object detection using deep learning aims to achieve meaningful information about target objects from images. In general, models assume that the testing images are similar to the training images. As a consequence, the model's performance degrades on the dataset with different visual characteristics. Hence, a 'domain' is defined as the dataset having the same semantic but showing different distribution, and making a domain-robust model is getting growing attention.
This paper defines the characteristics of a domain as 'style' and tries to resolve domain generalization problem with style augmentation, which diversifies the training input's style. We propose a new style augmentation method using a style transfer module that fuses training dataset domain styles to make various styles. Additionally, the inputs between domains are controlled by an input selection method to resolve imbalance between domains. We apply our training scheme to mitosis detection and fashion object detection to show the efficiency of our proposed scheme.
딥러닝을 활용한 이미지 내 객체 탐지에서, 모델은 이미지로부터 객체에 관한 유용한 정보를 찾아내는 것을 학습한다. 이때 일반적으로 모델들은 학습 시 사용되는 이미지와 활용 시 사용되는 이미지가 비슷할 것이라고 가정한다. 그렇기 때문에 학습 데이터와 다른 생김새를 가진 데이터를 사용하는 경우, 모델이 제 성능을 내지 못하는 문제가 발생한다. 이처럼 같은 의미를 가지지만 시각적으로 다른 이미지 분포를 보이는 데이터 그룹을 도메인으로 정의하고, 이러한 도메인 변화에 강한 모델을 만드는 연구의 중요성이 증가하고 있다.
본 논문에서는 각 도메인이 가지는 생김새적 특성을 '스타일'로 정의하며, 인풋을 다양한 스타일로 변경하는 스타일 증강 기법을 통해 도메인 일반화 문제를 해결하고자 한다. 스타일 변환 모듈을 통해 기존 도메인 스타일을 섞어서 다양한 스타일을 만든 뒤, 인풋 스타일을 변경하는 새로운 스타일 증강 기법과, 도메인 간 입력을 제어하는 입력 선택 방식을 통해 모델이 도메인에 일반화될 수 있는 학습 기법을 제안한다. 또한, 제안한 학습 방식의 효용성을 보이기 위해 분열기 세포 감지 및 패션 객체 감지 학습모 델에 위 학습방식을 적용하여 위 학습 방식이 도메인 일반화에 효용이 있다는 것을 입증하였다.