A low power face recognition (FR) convolutional neural network (CNN) processor is proposed with high power efficiency to achieve always-on FR in mobile devices. Three key features enable a power-efficient FR CNN. First, tile-based clustering (THC) is proposed for reducing the computation overhead of hierarchical clustering Second, a low latency tile-based hierarchical clustering core is proposed. It supports an approximated clustering method that removes distance updates and increases pipeline utilization by up to 98.6%. Finally, a similar feature skipping binary convolution core with separated accumulation cores is proposed to increase power efficiency through skipping redundant MAC operation between duplicated input features and weights. It can reduce 35.8% of the total computation considering both CNN and THC. The proposed features enable the proposed processor to operate FR CNN with 17.3 TOPS/W power efficiency, which is 1.3× higher compared to the previous state-of-the-art FR CNN processor. Implemented in 65nm CMOS technology, the 6mm2 FR CNN processor shows 0.5mW power consumption at 1 frames-per-second always-on face recognition.
제안하는 저전력 안면 인식 (FR) 컨볼루션 신경망 (CNN) 프로세서는 모바일 장치에서 always-on FR을 수행하기 위해 높은 전력 효율을 달성하였다. 세 가지 주요 기능으로 전력 효율적인 FR CNN이 가능하다. 먼저, 본 논문에서는 계층 적 클러스터링의 계산 오버 헤드를 줄이기 위해 타일 기반 클러스터링 (THC)이 제안한다. 둘째, 저 지연 타일 기반의 계층 적 클러스터링 코어를 제안하였다. 코어에서는 거리 업데이트를 제거하고 파이프 라인 사용률을 최대 98.6 %까지 증가시키는 대략적인 클러스터링 방법을 지원한다. 마지막으로, 분리 된 accumulation 코어를 갖는 이진 컨볼루션 코어가 유사한 입력 특징들과 가중치 사이의 중복 MAC 동작을 단 한번만 수행함으로써 연산을 건너 뛰고, 전체 연산량을 35.8 %만큼 줄일 수 있다. 제안 된 프로세서는 17.3 TOPS / W 전력 효율로 FR CNN을 작동 할 수 있으며, 이는 이전의 최신 FR CNN 프로세서보다 1.3 배 더 높으며, 소비 전력은 0.25 배만큼 감소하였다. 65nm CMOS 기술로 구현 된 6mm2 FR CNN 프로세서는 초당 1 프레임의 상시 얼굴 인식에서 0.5mW 전력 소비를 보여준다.