서지주요정보
Reinforcement learning-based mixed-precision quantization for lightweight deep neural networks = 경량 심층신경망을 위한 강화학습 기반 혼합정밀도 양자화
서명 / 저자 Reinforcement learning-based mixed-precision quantization for lightweight deep neural networks = 경량 심층신경망을 위한 강화학습 기반 혼합정밀도 양자화 / Juri Jung.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8037220

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 21084

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Network quantization has been widely studied to compress the deep neural network in mobile devices. Conventional methods quantize the network parameters of all layers with the same fixed precision, regardless of the number of parameters in each layer. However, quantizing the weights of the layer with many parameters is more effective in reducing the model size. Accordingly, in this paper, we propose a novel mixed-precision quantization method based on reinforcement learning. Specifically, we utilize the number of parameters at each layer as a prior for our framework. By using the accuracy and the bit-width as a reward, the proposed framework determines the optimal quantization policy for each layer. By applying this policy sequentially, we achieve weighted-average 2.97 bits for the VGG-16 model on the CIFAR-10 dataset with no degradation of the accuracy, compared with its full-precision baseline. We also show that our framework can provide an optimal quantization policy for the VGG-Net and the ResNet to minimize the storage while preserving the accuracy.

네트워크 양자화는 모바일 기기에 사용되는 심층신경망을 압축하기 위해 광범위 하게 연구되어왔습니다. 종래의 방법들은 각 레이어 별 매개변수 수에 관계없이 동일한 고정 정밀도로 모든 레이어의 네트워크 매개변수들을 양자화합니다. 그러나, 매개변수 수가 많은 레이어의 가중치를 양자화 하는 것이 모델 크기를 줄이는데 더 효과적입니다. 이에 따라, 본 논문에서는 강화학습을 기반으로 한 새로운 혼합 정밀도 양자화 방법을 제안합니다. 특히, 우리는 프레임워크에 각 레이어의 매개변수 수를 우선으로 활용하였습니다. 제안된 프레임워크는 정확도와 비트 폭을 보상으로 사용하여 각 레이어에 대한 최적의 양자화 정책을 결정합니다. 이 정책을 순차적으로 적용함으로써 우리는 CIFAR-10 데이터 세트의 VGG-16 모델에 대한 완전 정밀도 기준과 비교하여 정확도 저하없이 가중평균 2.97 비트를 달성하였습니다. 또한 우리의 프레임워크가 VGG-Net과 ResNet에 대해 최적의 양자화 정책을 제공하여 정확도를 유지하면서 저장용량을 최소화 할 수 있음을 보여줍니다.

서지기타정보

서지기타정보
청구기호 {MEE 21084
형태사항 iv, 40 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정주리
지도교수의 영문표기 : Changick Kim
지도교수의 한글표기 : 김창익
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 31-38
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서