서지주요정보
Encoding convolutional neural networks for efficient hardware acceleration = 효율적인 하드웨어 가속을 위한 CNN 인코딩
서명 / 저자 Encoding convolutional neural networks for efficient hardware acceleration = 효율적인 하드웨어 가속을 위한 CNN 인코딩 / Hyeonwook Wi.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036074

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 20060

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recent many industrial and commercial fields are making an effort to deploy the DCNN on mobile devices. However, the layer depth of DCNNs deepens as user-applications become more complicated and require higher accuracy, thus resulting in an increasing number of computation and parameter size. Two solutions for mitigating this issue is quantization of the parameters of DCNNs and data encoding to lower the complexity of computing units and memory footprint with a little accuracy drop. In this thesis, to mitigate the above problems in two quantized networks, which are extremely-quantized weight CNNs, multi-bit quantized CNNs, data encoding schemes are proposed. And then, customized hardware accelerators are designed to verify the efficiency of these proposed schemes. As a result, in extremely-quantized weight CNNs, effective bit per weight is reduced to 0.67-0.80 bit achieving 4.52-7.70x and 1.52-2.21x improvement of performance and energy efficiency respectively, with higher accuracy compared to previous binary weight CNN work. In multi-bit quantized CNNs, about 12.7-26.0\% energy saving is achieved from iso-accuracy comparison, so that a design option, that can be the most efficient compared to the baselines considering accuracy-energy trade-off, is provided.

최근 많은 산업 및 상업 분야에서 모바일 장치에서 DCNN을 전개하기 위해 노력하고 있다. 그러나 DCNN의 레이어 깊이는 유저 어플리케이션이 더욱 복잡해지고 더 높은 정확도를 요구함에 따라 깊어져서 계산 및 매개 변수 크기가 증가한다. 이 문제를 해결하기위한 두 가지 솔루션은 연산 복잡도 및 메모리 풋 프린트의 낮추기 위한 DCNN 양자화와 데이터 인코딩이다. 본 학위 논문에서는 극도로 양자화된 웨이트 CNN, 다중 비트 양자화 된 CNN에서 상기 문제점을 완화하기 위해 데이터 인코딩 방식이 제안된다. 그런 다음 제안된 방식의 효율성을 입증하기 위해, 맞춤형 하드웨어 가속기가 설계된다. 결과적으로, 극도로 양자화된 웨이트 CNN에서, 유효 웨이트 당 비트는 0.67-0.80 비트로 감소되어 각각 4.52-7.70x 및 1.52-2.21x의 성능 및 에너지 효율 개선을 달성하며, 이전의 바이너리 웨이트 CNN과 비교하여 더 높은 정확도를 보인다. 다중 비트 양자화 된 CNN에서는, 같은 정확도 상의 비교를 통해 약 12.7-26.0 \%의 에너지 절약이 달성되므로 정확도-에너지 트레이드 오프를 고려할 때 가장 효율적인 네트워크 설계 옵션이 제공된다.

서지기타정보

서지기타정보
청구기호 {MEE 20060
형태사항 iv, 41 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 위현욱
지도교수의 영문표기 : Lee-Sup Kim
지도교수의 한글표기 : 김이섭
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 35-37
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서