서지주요정보
(An) explainable AI accelerator with dynamic workload allocation and heat map compression/pruning = 동적 워크로드 할당과 활성화 맵 압축 및 프루닝을 활용한 설명 가능 인공지능 가속기
서명 / 저자 (An) explainable AI accelerator with dynamic workload allocation and heat map compression/pruning = 동적 워크로드 할당과 활성화 맵 압축 및 프루닝을 활용한 설명 가능 인공지능 가속기 / Junsoo Kim.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040745

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 23038

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

This paper presents EPU, the first explainable AI accelerator that achieves 367FPS heat map generation for ResNet34 and state-of-the-art hardware efficiency. It introduces a new data compression format and sparsity-aware computing core for improving system performance. It proposes a dynamic inference-explanation workload allocation with a customized on-chip network to reduce external memory access by 63.7%. It also proposes point-wise gradient pruning that reduces the size of heat maps by 7.01x.

이 논문에서는 설명가능 인공지능 알고리즘을 가속하는 첫 하드웨어 아키텍처를 다루고 있다. 논문에서 제안한 가속기는 초당 최대 365개의 활성화맵을 출력할 수 있으며, 면적과 소비전력 대비 최첨단 성능을 보이고 있다. 제안한 가속기는 활성화맵에 특화된 새로운 압축 데이터 포맷을 제안하고, 해당 포맷을 활용해 희소행렬을 효과적으로 처리할 수 있는 구조를 제안하였다. 또한 추론 과정과 설명 과정에 대해 동적 워크로드 할당 방법과 이에 맞는 온칩 네트워크를 제안함으로서 외부 메모리 접근을 63.7%로 줄일 수 있었다. 추가적으로, 채널방향 경사도 프루닝 방법을 제시해 희소성을 극대화하고 정확도를 잃지 않도록 하였으며 활성화 맵을 최대 7.01x 줄였다.

서지기타정보

서지기타정보
청구기호 {MEE 23038
형태사항 ii, 22 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김준수
지도교수의 영문표기 : Joo-Young Kim
지도교수의 한글표기 : 김주영
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 18-19
주제 Machine Learning
Deep Learning Network
Artificial Intelligence Accelerator
Explainable Artificial Intelligence
머신 러닝
딥러닝
인공지능 하드웨어 가속기
설명가능 인공지능 알고리즘
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서