This research is motivated by the question: When data is scare, how can we use data expansion methods or generative models to learn better representations of deep models for visual recognition? To solve the question, we propose a Generative Translation Classification Networks (GTCN) that employ joint learning to train a classifier and a generative stochastic translation network end-to-end. The methods are researched on face liveness detection, cat/dog classification, and artist classification as experimental applications.
이 논문은 학습 데이터가 부족할 때 생성 모델을 이용하여 데이터를 확장하고 동시에 영상 인식을 하는 딥 모델의 특징 표현을 향상 할 수 있는 방법을 연구하였다. 영상의 생성 변환 인식 네트워크를 제안 하였고, 이 네트워크는 영상 인식기와 확률적 영상 생성기를 처음부터 함께 학습 하였다. 본 논문에서 제안하는 방법들은 얼굴의 진위 판별 검출, 동물 인식, 그림의 화가 인식을 응용으로 실험하고 검증되었다. 그 결과 제안하는 생성모델과의 동시 학습 방법이 영상의 인식률을 향상하는 것을 보였다.