서지주요정보
(A) low-power graph convolutional network processor for real-time 3D point cloud semantic segmentation = 실시간 3D 점 구름 분할을 위한 저전력 그래프 컨볼루션 네트워크 프로세서
서명 / 저자 (A) low-power graph convolutional network processor for real-time 3D point cloud semantic segmentation = 실시간 3D 점 구름 분할을 위한 저전력 그래프 컨볼루션 네트워크 프로세서 / Sangjin Kim.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8037159

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 21023

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

A low-power graph convolutional network (GCN) is proposed for accelerating 3D point cloud semantic segmentation (PCSS) in real-time on mobile devices. Three key features enable the low power GCN-based 3D PCSS. First, the new hardware friendly GCN algorithm, sparse grouping based dilated graph convolution (SG-DGC) is proposed and reduce power consumption through the reduction of computation and external memory access (EMA). SG-DGC reduces 71.7% of the overall computation and 76.9% of EMA through the sparse grouping of the point cloud. Proposed processor accelerate the GCN with the two-level pipeline (TLP) consisting of the point-level pipeline (PLP) and group-level pipelining (GLP). The PLP enables point-level module-wise fusion (PMF) which reduces 47.4% of EMA with minimal additional on-chip memory footprint through point-level execution. The GLP increased the core utilization by 21.1% through balancing the workload of graph generation and graph convolution with the loosened data dependency through SG-DGC and enable 1.1× higher throughput. Finally, center point feature reuse (CPFR) reuse computation results of the redundant operation and reduces 11.4% of computation. The processor is implemented with 65nm CMOS technology, and the 4.0mm$^2$ 3D PCSS processor show 95mW power consumption while operating in real-time of 30.8 frames-per-second 3D PCSS with 4k points.

모바일 기기에서 실시간 3D 점 구름 분할을 위해 낮은 전력 소모를 갖는 그래프 컨볼루션 네트워크 (GCN) 프로세서를 제안 한다. 먼저, 하드웨어 친화적인 새로운GCN 알고리즘SG-DGC를 제안하여 연산량과 외부 메모리 접근을 줄여 전력 소모를 줄였다. 그리고 제안된 프로세서는 GCN 연산을 위해 포인트 수준 파이프라인과 그룹 수준 파이프 라인으로 구성된 2단계 파이프라인을 사용하였다. 포인트 수준 파이프라인은 모듈 단위 융합을 통해 외부 메모리 접근을 47.4% 감소 시켰다. 또한 그룹 수준 파이프라인은 그래프 생성과 그래프 컨볼루션의 작업량을 일정하게 유지해 코어 활용률을 21.1% 높였다. 마지막으로 중심 점 특징 재사용을 이용해 중복된 연산 시 연산 결과를 재사용 하여 11.4%의 연산을 추가로 감소시켰다. 65nm CMOS 기술을 통해 4.0mm$^2$로 집적된 그래프 컨볼루션 네트워크 프로세서는 95mW의 전력 소모를 보이며 30.8 FPS의 처리량을 달성 합니다.

서지기타정보

서지기타정보
청구기호 {MEE 21023
형태사항 iii, 26 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김상진
지도교수의 영문표기 : Hoi-Jun Yoo
지도교수의 한글표기 : 유회준
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 23-24
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서