서지주요정보
A real-time human action description processor with spatio-temporal HMAX model = 시공간 기반의 계층적 인식기를 이용한 실시간 인간 행동 기술 프로세서
서명 / 저자 A real-time human action description processor with spatio-temporal HMAX model = 시공간 기반의 계층적 인식기를 이용한 실시간 인간 행동 기술 프로세서 / Seong-Wook Park.
저자명 Park, Seong-Wook ; 박성욱
발행사항 [대전 : 한국과학기술원, 2014].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8026450

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 14042

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

In these days, human action recognition is applied to various applications such as gesture recognition embedded in some mobile devices and video retrieval which is a searching technique for users to find a specific part containing acting human. For these applications, human action recognition is asked for having both real-time performance for good user interactivity and high action recognition accuracy. A bio-inspired hierarchically description model named HMAX is known as one of the most accurate human action description algorithms, whereas its too much slow processing speed is a problem to be applied for many applications mentioned above. Generally speaking, 30 FPS(Frames Per Second) processing speed is required for comfortable user interaction. However, it is figured out that HMAX has about 1 FPS processing speed from software simulation with general purpose CPU. Its slow processing speed comes from the template matching stage called `second simple stage` because of two main factors; (1) number of matched templates, and (2) SAD processing time per a template. The total processing time of this stage is mainly proportional to them, and they should not be ignored. This is the reason why template matching stage is the bottleneck of overall HMAX processing. For reducing critical burden of the template matching stage, two algorithm modification methods are introduced. One is spatio-temporal ROI(Region-Of-Interest) processing which reduces unit SAD processing time per a template. This method reduc-es SAD processing time per a template by 69.33%. Another is class pre-selection which reduces total number of matching templates. This method reduces total number of template by 93.98%. Two modification methods accompanies with additional computation cost. For accurate spatio-temporal ROI generation, fast conversion operation between 2-dimensional position information and internal address of SRAM is needed. In addition, multi-dimensional sorting operation should be supported for class pre-selection. To solve this problem, a real-time human action description processor is implemented. It contains two dedicated hardware with FSM(Finite State Machine) for optimized two additional operations. The 1.04mm2 block is fabricated in a 0.13um 8 metal layer process. Human action recognition performance evaluation on the six-classes human action testset shows that throughput increases up to 60 FPS.

인간의 행동을 인식하는 기술은 최근에 여러 가지 모바일 어플리케이션과 맞물려서 제스쳐 인식, 영상 부분 검색 등에서 활용하기 위해 연구되고 있는 추세이다. 행동 인식 기술이 실생활 어플리케이션에 적용되기 위해서는 다음의 두 가지 요건을 만족시켜야 한다. 첫 번째로, 정확한 인식 능력이다. 사용자에게 불편함을 느끼게 하는 오류를 줄이기 위해서는 인식 정확도가 높아야 한다. 이를 위해서 본 논문에서는 가장 정확한 행동 인식 알고리즘 중 하나인 HMAX를 채용하였다. 두 번째로, 실시간 처리 능력이다. 앞서 언급한 제스쳐 인식과 같은 경우에는 사용자와 기계 간의 즉각적인 소통이 필요하고 이에 따라 실시간 처리 능력의 요건인 최소 30 frames/sec를 만족시켜야 한다. 가장 정확한 행동 인식 알고리즘 중 하나인 HMAX는 첫 번째 요구 조건인 인식 정확도는 만족시켰으나, 2-D 커널 연산이 많기 때문에 두 번째 요구 조건인 실시간 처리를 만족시키지 못했다. 본 연구에서는 이러한 HMAX를 실생활 어플리케이션에 적용시킬 수 있도록 시공간 관심영역 기반의 처리와 이중 클래스 선택의 두 가지 알고리즘 개선을 통해 인식 정확도의 감소가 거의 없는 최적화에 성공하였다. 그리고, 이 때 발생하는 오버헤드를 줄이기 위해 각 연산에 특화된 하드웨어 구조인 spatio-temporal memory structure와 class refinement structure가 함께 구현된 가속기를 제안하였다. 실험 결과, 본 연구에서 제안하는 인간 행동 기술 프로세서는 약 60.00 frames/sec의 높은 throughput을 가진다. 기존 general-purpose CPU에서 HMAX 처리 시간이 약 1.15 frames/sec의 낮은 처리 속도를 가짐을 생각해볼 때 약52.17x의 처리 속도 증가를 얻을 수 있었다. 그리고 두 가지 알고리즘 최적화를 통해 감소치가 거의 없는 91.6%의 인식 정확도를 얻을 수 있었다. 결과적으로, 가장 높은 처리 속도를 가진 인간 행동 기술 프로세서를 구현하였다.

서지기타정보

서지기타정보
청구기호 {MEE 14042
형태사항 iii, 32 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박성욱
지도교수의 영문표기 : Hoi-Jun Yoo
지도교수의 한글표기 : 유회준
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 References : p. 29
주제 Human action description
HMAX
Spatio-Temporality
Real-Time Processor
인간 행동 기술
계층적 인식기
시공간 기반
실시간 프로세서
QR CODE qr code