Adaptive rate control and fast motion vector refinement for heterogeneous transcoding in DCT domain = DCT 영역의 변환부호화를 위한 적응적 비트율 제어 및 고속 움직임벡터 추정 기법
Video communication requires the seamless delivery of video content to a broad range of users with different bandwidth and resource constraints. Transcoding is an essential technique for real-time video communications, video streaming, and VoD (Video on Demand) services over heterogeneous networks which may require different QoS (Quality of Service). In addition to the heterogeneity of present communication networks, the heterogeneity of the user preference for visual quality and picture resolution makes it even more important to design efficient transcoding algorithms. Furthermore, the video compression standards used by the source signal and the client device may not be the same. A possible scenario involves the MPEG-1 and MPEG-4 standards. MPEG-1 was designed for digital storage and CD-ROM application, while MPEG-4 has been proposed for the transmission of video in a wireless and error-prone channel due to its efficient coding scheme and robustness to channel errors. This scenario is becoming particularly important for transmitting stored video over low bandwidth channels such as the mobile networks and the Internet. So far, however, homogeneous transcoding of MPEG-1 to MPEG-1, MPEG-2 to MPEG-2, H.261 to H.261, and H.263 to 1-1.263 have been investigated intensively. Therefore, efficient heterogeneous transcoding algorithms must be designed to fix those heterogeneities. In this dissertation, we propose a heterogeneous transcoding scheme that converts an MPEG-1 bitstream of high bit-rate and spatial resolution into an MPEG-4 bitstream with lower bit-rate and lower spatial resolution in DCT domain. The first technique is an efficient Laplacian model-based requantization for INTRA pictures particularly to improve the picture quality and coding efficiency of INTRA pictures. The quantizer for MPEG-1 INTRA MB usually uses a quantization matrix while the quantizer for MPEG-4 simple profile does not. As a result, the quantization step sizes of the two quantizers may not be the same even for the same quantization parameter. Due to this mismatch in the quantization step size, a transcoded MPEG-4 sequence can suffer from serious quality degradation and the number of bits produced by transcoding increases from the original MPEG-1 video sequence. To solve these problems, an efficient method is proposed to identify a near-optimum reconstruction level in the transcoder. In addition, a Laplacian-model based PDF (probability distribution function) estimation for the original DCT coefficients from an input MPEG-1 bitstream is presented, which is required for the proposed requantization. The obtained results can be efficiently applied to VoD service where only I pictures are requested for fast-forward or fast-reverse display of stored video clips by the client. Secondly, we present an adaptive rate control for controling the new target bit-rate of MPEG-4. For adaptive rate control, we propose an efficient R-Q model-based rate control where R-Q characteristics predicted from past picture of the same picture type is used in combination with R-Q data measured from the current picture. Our adaptive model takes into account the effect of picture dependencies arising in motion-compensated video coding, and we demonstrate that they can be used to have precise control of the bit rate without buffer underflow and overflow. Thirdly, we propose a fast motion vector refinement for MPEG-1 to MPEG-4 transcoding with spatial down-sampling in DCT domain. For the DCT domain transcoding to lower spatial resolution pictures, DCT domain down-sampling is applied and a base motion vector (BMV) for the down-sampled MPEG-4 macroblock is to be calculated from the input motion vectors operating on the higher spatial resolution image. Quality can be significantly improved by refining the BMV. Starting with the BMV, the motion vector refinement (MVR) scheme searches for a refinement motion vector. The proposed MVR scheme generates refined motion vectors for down-sampled video that are close to optimum motion vectors obtained from full-search MVR with significantly less computational effort.

영상 부호화 기술과 네트워킹 기술이 발전하면서, 다양한 종류의 영상 부호화 표준과 네트워크 환경이 존재하게 되었다. 이러한 다양한 환경에서 영상 서비스를 효과적으로 제공하기 위한 대표적인 기술로 변환부호화 (transcoding)에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 영상 전송 환경에서 발생할 수 있는 여러 가지 다양성에 의해 발생 가능한 문제를 변환부호화기 (transcoder)를 통해 효과적으로 해결 하고자 한다. 영상 전송에서 발생할 수 있는 대표적인 다양성의 문제로는 영상 부호화 표준의 다양성, 전송 채널 대역폭의 다양성, 그리고 사용자가 요구하는 영상 품질 및 해상도의 다양성을 들 수 있다. 먼저, 본 논문에서는 부호화 표준의 다양성을 위해서 MPEG-1을 MPEG-4로 변환 부호화하는 변환부호화기를 고려한다. 그리고, 전송 채널 대역폭과 영상 품질의 다양성을 위해서 기존의 비트율 감축 및 해상도 축소 변환부호화기의 성능을 개선시키기 위한 새로운 주요한 기법들을 제안한다. 본 논문에서는 효율적인 변환부호화기의 설계를 위해 크게 다음의 3 가지의 주요 기법을 제안한다. 첫 번째로, 변환부호화에서 INTRA 화면의 화질과 부호화 효율을 개선시키기 위해 라플라스 (Laplacian) 모델을 기반으로 재양자화를 하는 방법을 제안한다. 이 방법을 위해서, 라플라스 모델을 변환부호화기에서 간단하면서 정확하게 추정하는 방법을 제시한다. 두 번째로, 변환부호화기의 출력이 되는 MPEG-4 비트열을 고화질과 정확한 목표 비트율로 제어 하기 위해, 적응적 R-Q (rate-quantization) 모델을 이용하여 비트율을 적응적으로 제어하는 방법을 제안한다. 이 방법을 위해서, 로가리드믹 (logarithmic) R-Q 관계의 특성이 선형임을 이용하여 로가리드믹 R-Q 모델을 고안해 내고, 이 모델을 바탕으로 적응적인 비트율 제어 기법을 제시한다. 세 번째로, 해상도 축소를 위한 변환부호기에서 보다 나은 성능을 갖는 움직임 벡터를 추정하는 방법을 제안한다. 이 방법은 크게 두 가지의 효과적인 알고리듬에 바탕을 두고 있다. 첫 번째 알고리듬은 입력되는 움직임벡터 정보를 이용하여 탐색 영역을 축소하여 움직임 벡터 추정에 필요한 계산량을 줄이는 것이고, 두 번째 알고리듬은 움직임 벡터 추정을 위해 필요한 DCT 블록 추출 (extraction) 에 요구되는 계산량을 줄이는 방법이다. 이 두 가지 알고리듬의 복합적인 효과로 인해 고속 움직임 벡터 추정이 가능하다.


주제 video coding
rate conrol
motion vector estimation
영상 부호화
변환 부호화
비트율 제어
움직임 벡터 추정
