서지주요정보
(A) computing-in-memory-based human pose estimation accelerator with resource-efficient macro for mobile devices = 모바일 디바이스를 위한 리소스 효율적인 메모리 내 연산 기반 인간 포즈 추정 가속기
서명 / 저자 (A) computing-in-memory-based human pose estimation accelerator with resource-efficient macro for mobile devices = 모바일 디바이스를 위한 리소스 효율적인 메모리 내 연산 기반 인간 포즈 추정 가속기 / Beomseok Kwon.
발행사항 [대전 : 한국과학기술원, 2024].
Online Access 비공개원문

소장정보

등록번호

8042188

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 24076

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Human pose estimation (HPE) is a promising solution for accurately understanding the state and context of human actions in virtual reality (VR). A high frame rate with low-power HPE processing is required for a realistic user interaction experience in battery-limited mobile devices. The proposed HPE accelerator is a computing-in-memory (CIM) based accelerator that computes depth-wise separable convolution (DWSC) of a lightweight HPE network. Three key features contribute to a resource-efficient CIM accelerator: 1) Dual-mode CIM computes DWSC with a reconfigurable homogenous architecture, resulting in $2.68$ times higher throughput than previous analog CIMs. 2) Effective layer-aware unrolling performs bit-parallel computation on dual-mode CIM with fewer ADC operations, achieving 46 times higher throughput than before. 3) Adaptive fused intermacro balancing improves latency balance in layer fusion execution, leading to a $57.0 %$ higher frame rate than before. The proposed HPE accelerator is implemented in $28nm$ CMOS technology. It achieves higher computation resource utilization and operates HPE with a low energy-delay product of $27.6 uJ \cdot s$ in mobile VR devices.

인간 포즈 추정(HPE)은 가상 현실(VR)에서 인간 행동의 상태와 맥락을 정확하게 이해하기 위한 유망한 솔루션입니다. 배터리 제한이 있는 모바일 장치에서 실제 사용자의 상호 작용 경험을 위해서는 높은 프레임 속도와 저전력 HPE 처리가 필요합니다. 제안된 HPE 가속기는 경량화 HPE 네트워크의 깊이별 분리 가능한 컨볼루션 (DWSC)을 계산하는 메모리 내 연산 (CIM) 기반 가속기입니다. 리소스 효율적인 CIM 가속기에 기여하는 세 가지 주요 기능은 다음과 같습니다. 1) 듀얼 모드 CIM은 재구성 가능한 동종 아키텍처로 DWSC를 계산하여 이전 아날로그 CIM보다 처리량이 2.68배 더 높습니다. 2) Effective layer-aware unrolling 은 더 적은 수의 ADC 작업으로 듀얼 모드 CIM에서 bit-parallel 연산을 수행하여 이전보다 46배 더 높은 처리량을 달성합니다. 3) Adaptive fused inter-macro balancing 은 레이어 융합 실행 시 지연 시간 밸런스를 개선하여 이전보다 $57.0%$ 더 높은 프레임 속도를 구현합니다. 제안된 HPE 가속기는 28nm CMOS 기술로 구현됩니다. 더 높은 컴퓨팅 리소스 활용도를 달성하고 모바일 VR 장치에서 $27.6 uJ \cdot s$의 낮은 EDP로 HPE를 운영합니다.

서지기타정보

서지기타정보
청구기호 {MEE 24076
형태사항 iii, 17 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 권범석
지도교수의 영문표기 : Hoi-jun Yoo
지도교수의 한글표기 : 유회준
수록잡지명 : "A 92 fps and 2.56 mJ/frame Computing-in-Memory-based Human Pose Estimation Accelerator with Resource-Efficient Macro for Mobile Devices". IEEE Transactions on Circuits and Systems II: Express Briefs , 1 - 1(2023)
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 16
주제 computing-in-memory(CIM)
human pose estimation
capacitor-based analog computation
reconfigurable homogeneous architecture
SRAM
메모리 내 컴퓨팅
인간 포즈 추정
축전기 기반 아날로그 연산
재구성 가능한 동종 아키텍처
SRAM
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서