서지주요정보
Energy-efficient deep neural network processors with structured sparsity = 구조적 희소성을 활용한 에너지 효율적인 심층 신경망 프로세서
서명 / 저자 Energy-efficient deep neural network processors with structured sparsity = 구조적 희소성을 활용한 에너지 효율적인 심층 신경망 프로세서 / Soyeon Kim.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8038079

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 21133

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Energy-efficient deep neural network processors for mobile devices are proposed by creating structured sparsity and using it. First, GAN training processor is proposed to enable energy-efficient domain-specific optimization of GAN with the user’s local data. Selective layer retraining (SELRET) picks out layers that are effective in enhancing the quality of the retrained model. Without image quality degradation, the SELRET reduces the required computation by 69 %. Moreover, reordering layers for instance normalization (ROLIN) is proposed to reduce the EMA of intermediate data. The proposed processor is fabricated in a 65 nm CMOS process, showing 0.38 TFLOPS/W energy-efficiency. Second, A low power real-time visual object tracking (VOT) processor using the siamese network (SiamNet) is proposed for mobile devices. To achieve low power consumption and real-time operation, correlation-based spatial early stopping (CSES) is proposed. CSES reduces ~56.8% of the overall computation of the SiamNet by gradually eliminating the background. In addition, the dual mode reuse core (DMRC) is proposed for supporting both the convolution layer and the cross-correlation layer with high core utilization. Compared to previous VOT processors, the proposed processor shows state-of-the-art performance while showing lower power consumption.

구조화 된 희소성을 생성하고, 이를 사용하여 모바일 장치를 위한 에너지 효율적인 심층 신경망 프로세서가 제안되었다. 첫째, GAN 학습 프로세서는 사용자의 개별적인 데이터에 대한 GAN의 에너지 효율적 도메인별 최적화를 가능하게 한다. 선택적 레이어 재교육 (SELRET)은 재학습된 모델의 품질을 향상시키는 데 효과적인 레이어만 선택적으로 학습함으로써 이미지 품질의 저하없이 전체 계산을 69%를 감소시킨다. 또한 인스턴스 정규화로 인한 추가적인 External memory access (EMA)를 줄이기 위해 인스턴스 정규화를 위한 계층 재정렬 (ROLIN)이 제안되었다. 제안된 프로세서는 65nm CMOS 공정으로 제작되어 0.38 TFLOPS / W 에너지 효율성을 보여준다. 둘째, 샴 네트워크를 사용하는 모바일 기기용 저전력 실시간 시각적 객체 추적 프로세서가 제안되었다. 낮은 전력 소비와 실시간 작동을 달성하기 위해 제안된 상관 기반 공간 조기 정지 (CSES)는 배경을 점진적으로 제거하여 샴 네트워크 전체 계산의 최대 56.8 %를 줄입니다. 또한, 높은 코어 utilization으로 컨볼 루션 계층과 상호 상관 계층을 모두 지원하기 위해 이중 모드 재사용 코어 (DMRC)가 CSES와 함께 제안되었다. 결과적으로, 이전 VOT 프로세서에 비해 제안된 프로세서는 낮은 전력 소비량과 함께 최첨단 성능을 보인다.

서지기타정보

서지기타정보
청구기호 {MEE 21133
형태사항 iv, 36 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김소연
지도교수의 영문표기 : Hoi-Jun Yoo
지도교수의 한글표기 : 유회준
수록잡지명 : "An Energy-Efficient GAN Accelerator with On-chip Training for Domain Specific Optimization". IEEE Asian Solid-State Circuits Conference (A-SSCC), pp.1-4(2020)
수록잡지명 : "A 64.1mW Accurate Real-Time Visual Object Tracking Processor With Spatial Early Stopping on Siamese Network". IEEE Transactions on Circuits and Systems II: Express Briefs, v.68.no.5, pp.1675-1679(2021)
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 31-33
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서