서지주요정보
Energy-efficient object recognition algorithm and hardware architecture for mobile vision platform = 모바일 비전 플랫폼을 위한 물체 인식 알고리즘과 하드웨어 아키텍쳐
서명 / 저자 Energy-efficient object recognition algorithm and hardware architecture for mobile vision platform = 모바일 비전 플랫폼을 위한 물체 인식 알고리즘과 하드웨어 아키텍쳐 / Jinwook Oh.
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8029478

소장위치/청구기호

학술문화관(문화관) 보존서고

DEE 13071

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In recent years, object recognition has been widely adopted in various real-life applications. Mi-crosoft’s Kinect uses body-part recognition as a gaming interface, and automakers such as Toyota and BMW incorporate vehicle, pedestrian, and lane detection in their advanced driver-assistance systems. Smartphones that operate within a low power budget also use object recognition for booming applications such as augmented reality, face-recognition-based security, and gesture-recognition-based user interfaces. In such applications, the Scale Invariant Feature Transform (SIFT) is the most popular candidate for how to extract some interest points out of the objects and describe them in a way that invariants to translation, scal-ing, and rotation. However, SIFT-based object recognition consumes a lot of power because of the heavy computations required in descriptor generation and matching. In addition, today’s high-resolution image sensors and tight power budgets make real-time SIFT implementation in mobile devices even harder; recent mobile cameras provide more than 720p resolution at 30 frames per second (fps), while the power consump-tion on mobile CPUs and GPUs ranges from roughly 0.1 W to 1 W. To realize real-time SIFT-based object recognition that meets these high resolution and low power requirements, we propose an object-recognition processor using (1) an attention-based recognition algorithm for energy efficiency, (2) a heterogeneous multicore architecture for data and thread parallelism, and (3) per-formance model based fine-grain dynamic voltage and frequency scaling. The processor determines regions of interest (ROIs)─the parts of the image that likely contain target objects─which lets us perform the main recognition on only the selected regions, minimizing unnecessary computations. The heterogeneous multicore architecture provides several types of parallelism and so achieves high throughput and low power consump-tion for highly parallelizable recognition processing. The high-bandwidth NoC plays a role as the communica-tions backbone for tens of processing cores while meeting the high-resolution video sequence’s streaming de-mand of more than a few hundred megabytes per frame. To increase energy efficiency of the multi-core pro-cessor, the performance model based fine-grain dynamic voltage and frequency scaling is proposed for pro-cessing cores of 5-stage task-level pipeline. As a result, the fabricated SoC achieves 30 fps dynamic object recognition for unmanned aerial vehicle (UAV) system with 720p video streams while dissipating 320mW, achieving 2.54 times higher energy efficiency with 10.5nJ/pixel compared to the state-of-the-art vision pro-cessors.

최근에, 물체 인식은 다양한 실생활 어플리케이션에서 활용되고 있는데, 그 예로서, Mi-crosoft의 Kinect의 body-part 인식 기반 게임 인터페이스와 Toyota나 BMW의 보행자 차선 인식 기반 기반 운전자 보조 장치를 들 수 있다. 스마트폰과 같이 저전력 플랫폼에서 또한증강 현실이나 얼굴인식 기반 안전장치, 동작 인식 기반 사용자 인터페이스 등에 물체 인식 기술을 활용하고 있다. 이러한 어플리케이션들은 90% 이상의 높은 인식 정확도를 위하여, Scale Invariant Feature Transform (SIFT)을 사용하는데, 입력 영상에서 목표 물체를 인식하기 위해 영상의 모든 특징점을 128-D 벡터로 기술하고 데이터베이스의 모든 벡터들과 하나씩 비교하는 과정을 필요로 한다. SIFT는 물체의 회전, 크기, 시점의 변화에 대한 강인성을 확보하고 있는데, 환경 변화에 무관하게 높은 인식률을 확보할 수 있다는 장점이 있지만 그를 위한 복잡한 계산에 따른 높은 연산량이 문제가 된다. 그리고 오늘날의 모바일 비전 플랫폼의 입출력 영상 장치의 높은 해상도와 낮은 전력 마진은 SIFT 기반 실시간 물체 인식을 구현하기 더욱 어렵게 만들고 있다. 최근의 모바일 카메라는 1280 $\times$ 720 이상의 해상도를 30 frame/sec 의 처리성능을 유지하고 있으나, 모바일 CPU와 GPU는 0.1~1W의 전력 소모가 요구된다. 위의 해상도 및 저전력 요구 조건을 동시에 만족시키며, 실시간 SIFT 기반 물체인식을 구현하기 위하여, 본 연구는 저전력 물체 인식 알고리즘 및 그를 가속하는 하드웨어 아키텍쳐를 제안한다. 그 첫 번째 기술로서 (1) 주의 집중 기반 물체 인식 알고리즘으로서 Context-Aware Visual Attention Model (CAVAM) 을 제안하여 기존의 SIFT기반 인식 모델 대비 Workload을 50% 이상 감소시킨다. 그리고 (2) 이를 위한 이종 멀티코어 프로세서를 설계하여 높은 데이터/쓰레드 병렬도로서 물체 인식 처리 성능을 30 frame/sec로 극대화 시키는 시스템을 완성하였다. CAVAM 기반 물체 인식프로세서의 에너지 효율성을 증가 시키기 위하여 (3) 프로세싱 코어의 성능 예측 모델을 제안하고 예측 모델 기반Dynamic Voltage Frequency (DVFS) 기법을 구현하여, 기존 프레임 단위의 DVFS 기법 대비 36%의 에너지 소모량을 감소시켰다. 위 기술을 종합하여 설계한 342 GOPS(Giga Operations Per Second) 의 고성능 물체인식 프로세서는 최종적으로30 frame/sec 의 실시간 성능을 보유하였고 이 때 9.6mJ/frame 전력 효율로서, 이는 기존 최신 기술 대비 2.54 배의 에너지 효율 증가를 달성하였다. 최종적으로, 프로세서를 실시간 물체 인식/추적 무인항공 시스템에 집적하여 실제 환경에서 물체 인식동작과 에너지 관리 기법을 성공적으로 검증 및 시연하였다.

서지기타정보

서지기타정보
청구기호 {DEE 13071
형태사항 vii, 99 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 오진욱
지도교수의 영문표기 : Hoi-Jun Yoo
지도교수의 한글표기 : 유회준
수록잡지명 : "A 320mW 342GOPS Real-Time Dynamic Object Recognition Processor for HD 720p Video Streams". IEEE Journal of Solid-State Circuits, v. 48. no.1, pp. 33-45(2013)
수록잡지명 : "Low-Power, Real-Time Object Recognition Processor for Mobile Vision Systems". IEEE Micro, 12, pp. 38-50(2012)
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학과,
서지주기 References : p. 89-93
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서