Block matching motion estimation has been widely adopted to reduce the temporal redundancy of video sequences in various video compression standards. In those applications, motion estimation has a large effect on overall computational complexity and memory bandwidth. In this thesis, an efficient algorithm is proposed to reduce the computational complexity of block matching motion estimation by using the characteristics of spatial correlation. Identifying the boundary macroblocks associated with identical motion vectors, the proposed algorithm skips the motion vector search for inside macroblocks. To compromise the computational complexity and the estimation accuracy, the number of inside macroblocks is restricted to the threshold and conditionally switched to the minimum for the alleviation of the incorrect motion vector propagation. Experimental results show that the proposed algorithm reduces the number of search points, executed instructions, and data memory references by 51.1%, 47.0%, and 45.2%, respectively, compared to the conventional motion estimation at the cost of negligible performance degradation, resulting in reducing the computational complexity and the memory bandwidth requirement of video compression.
The thesis also proposes a memory interface to increase the bandwidth of synchronous memories that are widely adopted for video compression applications. Memory latency and energy consumption can be reduced by effectively managing the states of banks. The local access history of each bank is considered to predict whether the successive memory access refers to the same row in the same bank or not and manage the states according to the prediction. Two-bit state machines are employed to predict the next memory mode based on the history of memory references. Experimental results show that the proposed interface, at the cost of negligible area overhead, reduces the memory latency and the energy consumption by 44.6% and 46.9%, respectively, over the conventional interface that always keeps the memory in idle state for video compression applications.
블록 정합 움직임 추정은 다양한 동영상 압축 표준에서 동영상 시퀀스에 내재되어 있는 시간적 중복성을 줄이기 위해 널리 채택되어왔다. 동영상 압축 표준에서 움직임 추정은 전체 시스템의 계산량과 메모리 대역폭에 상당한 영향을 미친다. 이 논문은 공간적 상관성을 이용하여 블록 정합 움직임 추정의 계산량을 줄이는 효율적인 알고리즘을 제안한다. 제안된 알고리즘은 동일한 움직임 벡터를 가지는 경계 매크로블록을 규명하여 내부 매크로블록에 대한 움직임 벡터 탐색을 수행하지 않는다. 움직임 추정의 계산량과 정확도를 적당하게 조정하기 위하여 내부 매크로블록의 최대 개수를 임계 값으로 제한하였고, 부정확한 움직임 벡터의 전파를 완화하기 위해 임계 값이 조건적으로 최소값으로 전환되도록 하였다. 실험 결과는 제안된 알고리즘이 일반적인 움직임 추정 방법과 거의 같은 성능을 가지면서, 탐색 위치, 수행된 명령어의 개수, 데이터 메모리 참조 개수를 각각 51.1%, 47.0%, 45.2% 줄여 동영상 압축의 계산량과 메모리 대역폭 요구량을 크게 줄일 수 있음을 보였다.
또, 이 논문은 동영상 압축 응용 분야에서 널리 사용되는 동기식 메모리의 대역폭을 증가시킬 수 있는 메모리 인터페이스를 제안한다. 동기식 메모리의 지연시간(latency)과 에너지 소모는 메모리 뱅크(bank)의 상태(state)를 효과적으로 관리하는 방법에 의해서 줄일 수 있다. 연속되는 메모리 접근이 동일한 뱅크의 동일한 행(row)을 참조하는지 예측하고, 그 예측에 따라 뱅크의 상태를 관리하기 위해서 각 뱅크의 지역적 접근 history가 사용된다. 메모리 참조의 history에 근거하여 다음 메모리 모드를 예측하기 위해서 2-bit state machine이 도입되었다. 실험 결과는 동영상 압축 응용에서 제안된 메모리 인터페이스가 메모리를 idle 상태로 유지하는 일반적인 메모리 인터페이스에 비해 거의 면적의 부가 (area overhead) 없이 메모리 지연과 에너지 소모를 각각 44.6%, 46.9% 줄여 메모리 대역폭을 크게 향상시킬 수 있음을 보였다.