서지주요정보
(A) hybrid FP-FXP precision deep learning processor with outlier compensation for image-to-image application = 이미지 변환을 위한 이상치 보정을 적용한 하이브리드 부동-고정점 소수점 딥러닝 프로세서
서명 / 저자 (A) hybrid FP-FXP precision deep learning processor with outlier compensation for image-to-image application = 이미지 변환을 위한 이상치 보정을 적용한 하이브리드 부동-고정점 소수점 딥러닝 프로세서 / Zhiyong Li.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8038098

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 21152

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

A Hybrid floating-point (FP) and fixed-point (FXP) deep learning processor with an outlier-aware channel splitting algorithm is proposed for image-to-image applications on mobile devices. Since the high quality of the reconstructed image through deep learning based image-to-image application requires high bit-precision (> FP16), the mobile processor suffers from the high computation power and large external memory access (EMA). In this work, the proposed algorithm reduces 16-bit FP data to 8-bit FXP data, and only few outliers (< 10%) are computed in 16-bit FP while maintaining the image reconstruction quality. Therefore, it reduces EMA by 45.5%. Moreover, the hierarchical processor accelerates these dense 8-bit FXP data and sparse 16-bit FP data, and the functional L2 memory aggregates the convolution output of them by forming the pipeline, which reduces 98% of latency. The proposed system is simulated in 28nm COMS technology, and it occupies 4.16mm2. The hierarchical processor successfully demonstrates the × 4 scale Full-HD super-resolution generation achieving 76 frames-per-second (fps) with 133.3 mW power-consumption at 0.9 V supply and 3.6 TOPS/W of energy-efficiency which is × 3.27 higher than the previous 16-bit FXP processor.

모바일 장치에서의 이상치를 인식해 채널 분할하는 알고리즘을 갖춘 하이브리드 부동소수점(FP) 및 고정 소수점(FXP) 딥 러닝 프로세서를 제안한다. 딥 러닝 기반 이미지-이미지 변환 애플리케이션을 통해 재구성 된 이미지의 고품질은 높은 비트 정밀도 (> FP16)가 필요하기 때문에 모바일 프로세서는 높은 계산 능력과 큰 외부 메모리 액세스 (EMA) 문제를 겪습니다. 제안 된 알고리즘은 16 비트 FP 데이터를 8 비트 FXP 데이터로 줄이고 이미지 재구성 품질을 유지하면서 16 비트 FP에서 소량의 이상치 (<10 %) 만 계산합니다. 따라서 EMA를 평균 45.5 % 감소시킵니다. 또한 계층 적 프로세서는 이러한 고밀도 8 비트 FXP 데이터와 희소 16 비트 FP 데이터를 가속화하고 기능적인 L2 메모리는 파이프 라인을 형성하여 이들의 합성 곱 연산 출력을 집계하여 98 %의 지연 시간을 줄입니다. 28nm COMS기술를 통해 본 프로세서는 4.16mm2의 면적으로 직접 됩니다. 제안된 계층 적 프로세서는0.9V 공급에서 133.3 mW의 전력 소비를 보이며 기존 16비트 연산기보다 3.27배 높은 3.6 TOPS / W의 에너지 효율로 76fps (초당 프레임 수)를 달성하는 × 4 스케일 풀 해상도(Full HD) 초고해상도 이미지 생성을 성공적으로 시연합니다.

서지기타정보

서지기타정보
청구기호 {MEE 21152
형태사항 iii, 19 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이지용
지도교수의 영문표기 : Hoi-Jun Yoo
지도교수의 한글표기 : 유회준
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 17-18
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서