Face detection is the first step in a wide range of face applications, such as facial keypoint localization, face recognition, facial expression analysis and other topics. As a special task of object detection, a broad study of face detection has been conducted. The standard face detection dataset has several challenges for face detection. In particular, it contains faces at the wide range of scales, illumination and requires more precise localization due to occlusions and pose changes. Although recent studies show that deep learning approaches can achieve impressive performance on most computer vision tasks, face's localization caused by the above mentioned problems were not be fully resolved yet. There are additional challenges such as the repetitive convolution operation in the sliding window method and the resizing procedure due to the fixed size constraint of the fully-connected layers, which make it have a high computational complexity. Our main inspiration is to construct fully convolutional network. The architecture takes arbitrarily-sized input and produces last layer's feature maps of corresponding size represented as facial component heat map. Add to this we adopt multi-task learning technique. To address these challenges, we propose three-fold: (1) multi-scale proposal network for facial component heat map, (2) detection network with face bound regression, (3) hard sample mining to enhance the effectiveness of detection network by selecting the informative samples. We adopt the standard evaluation protocol to strictly validate our method. Experimental results present that our method outperforms other existing methods having used the standard FDDB dataset for face detection with 83.29% in the true positive rate at 1,034 false alarms. From the comparison of runtime efficiency, we can verify our method with competitive computational complexity. Our approach casts a light on face detection commonly deemed as a barrier which could not find the breakthrough in a trade-off between the performance and processing speed.
얼굴 검출은 얼굴 정보를 이용한 다양한 응용분야의 필수적인 단계이다. 그 응용분야로는 얼굴의 특징점 추출, 얼굴 인식, 얼굴의 표정 분석 등이 있다. 물체 검출의 지역적인 주제로서 얼굴 검출에 대해 많은 연구가 진행되고 있다. 얼굴 검출의 표준이 되는 테스트 데이터 세트는 몇 가지의 어려운 문제를 제시하고 있다. 특히, 얼굴의 다양한 크기, 조명의 정도뿐만 아니라 얼굴의 가림과 자세의 변화는 얼굴 검출을 어렵게 하는 주요 원인이다. 최근에 러닝 기반의 딥러닝 방법에 대한 새로운 접근법이 제시되면서 컴퓨터 비전의 많은 분야에서 우수한 성능을 보였지만, 얼굴 검출에 대해서는 위에서 언급한 문제를 완전히 해결하지 못하고 있다. 이와 더불어 이러한 접근법은 불필요한 연산과정과 추가적인 전처리 과정을 포함함으로써 알고리즘의 복잡도를 증가시킨다. 본 연구에서는 fully 컨볼루셔널 구조에 대해 얼굴의 국부적인 특징 정보를 이용하여 앞서 제시된 문제를 해결하고자 한다. 첫 번째로 얼굴의 주요점으로 표현되는 히트맵을 멀티스케일로 구성한다. 두 번째는 이러한 결과에 대해 멀티태스크 접근법을 수행한다. 세 번째는 이러한 접근법을 극대화할 수 있는 hard sample 선별 방법을 도입한다. 제안하는 방법의 성능을 검증하기 위해 얼굴 검출에 대한 표준화된 측정법을 도입하고 이로부터 결과를 제시한다. 결과로 부터 제안하는 방법이 다른 알고리즘과 비교하여 성능지표에 대해 우수한 성능을 보인다. 그뿐만 아니라 알고리즘의 복잡도 측면에서도 경쟁력 있는 성능을 제시한다. 본 연구의 접근법은 검출 성능과 처리속도 사이의 갈림길에 선 얼굴 검출 분야에 대해 새로운 접근법을 제시하고 있다.