서지주요정보
A study on an ROI/xROI based rate control scheme in advanced video coding for video telephony applications
서명 / 저자 A study on an ROI/xROI based rate control scheme in advanced video coding for video telephony applications / Chang-Hoo Kim.
발행사항 [대전 : 한국정보통신대학교, 2009].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0001158

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS09-11 2009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Rate control is one of the most important schemes in video coding for constant bit rate (CBR) applications such as broadcasting and video telephony. 3GPP and 3GPP2 have adopted for video telephony services a recent video coding standard, H.264|MPEG-4 Part 10 Advanced Video Coding (AVC). The video telephony applications usually require video encoders to be designed to yield their output bitstreams at target bitrates. Since the channel bandwidth in 3G communication networks is very much limited for video telephony services, the overall quality of video data can be degraded in case of directly using an existing rate control algorithm recommended for AVC. Therefore, it is worthwhile to enhance a subjective quality of video contents via ROI based coding while controlling the output bit-rate. A facial region in a scene can be more importantly treated as regions of interest (ROI). However, a simple ROI based rate control which merely divides a frame into ROI and non-ROI is not enough to satisfy users in regard with the quality and does not consider the variation of output bit-rate. In this thesis, an ROI and xROI (extended ROI) based rate-control method is studied, which considers the coding of both the ROI and the xROI's in non-ROI to meet given target bitrates. In the proposed method, the QP values are increasingly assigned in MB wide inside the non-ROI away from ROI. This reduces the abrupt change in visual quality and the amounts of residual signals along the border between ROI and non-ROI. In this regard, the subjective visual quality is enhanced as well as the proposed rate control has flexibility to control the amounts of the output bit-streams. Besides, two approaches for controlling the amount of encoded bits are introduced to reduce the fluctuation of output bit-rate per GOP. One approach is a deterministic scheme using a look-up table which contains QP changes given some conditions. The other approach is an adaptive scheme based on gradient descent method such as least-mean-square (LMS) procedure. For the adaptive scheme, optimal bit allocation is made in the sense that the squared errors between the target bitrates and the output bitrates are minimized. In order to obtain the target bitrates, a rate-distortion model is incorporated and its parameters are estimated and updated every frame. The two rate control schemes are compared with that of Joint Model (JM) reference software. The experimental results show that the proposed schemes can more effectively meet the target bitrates with much less fluctuations with the better subjective quality than the existing rate control algorithm in JM reference software of AVC.

비트 율 제어는 방송, 영상통화와 같은 고정된 비트 율을 사용하는 응용분야에서 가장 중요한 기술 중에 하나이다. 3GPP와 3GPP2는 영상통화 서비스를 위해 최신 비디오 부호화 표준인 H.264|AVC를 채택했다. 영상통화 환경에서는 일반적으로 출력 비트 율이 목표 비트 율을 맞추도록 만들어진 비디오 부호화기를 필요로 한다. 3G 통신 네트워크 환경에서는 영상 통화 서비스를 위한 채널의 대역폭이 상당히 제한적이기 때문에, AVC에서 사용하던 기존의 비트 율 제어 방법을 그대로 사용할 경우 영상 데이터의 전체적인 화질 열화가 발생할 수 있다. 그러므로 출력 비트 량을 제어하면서 관심영역 기반 부호화 방법을 통해 영상의 주관적인 화질을 향상시키는 것은 의미가 있다. 영상에서 얼굴 영역은 관심영역으로서 보다 중요하게 다뤄질 수 있다. 그러나 프레임을 단순히 관심영역과 비 관심영역으로만 나누는 관심영역 기반 비트 율 제어 방법은 화질적인 측면에서 사용자들을 만족시키기에 충분하지 않고, 출력 비트 량의 변동폭을 고려하지 않는다. 이에 본 논문에서는 주어진 목표 비트 율을 충족시키기 위해 관심영역과, 비 관심영역 내 확장된 관심영역들을 기반으로 부호화를 고려하는 관심영역/확장된 관심영역 기반 비트 율 제어 방법을 연구한다. 이 제안된 방법에서는 ROI에서 거리가 멀어질수록 매크로블록 크기 단위로 QP 값을 점차적으로 증가시킨다. 이렇게 함으로써 관심영역과 비 관심영역 간의 급격한 화질차이를 완화시키고, 경계에서 발생하는 잔차 신호 량을 감소시킨다. 이로 인하여 주관적인 화질이 향상될 뿐 아니라, 출력 비트 량을 유연하게 조절할 수 있다. 게다가, GOP 단위로 출력 비트 량의 변동폭을 감소시키기 위해 부호화된 비트 량을 조절하는 두 종류의 방법들을 제안한다. 첫 번째 방법은 주어진 조건에 따른 QP의 변화 량을 정해주는 참조 표를 사용하는 방법이고, 두 번째 방법은 LMS 방법을 기반으로 한 적응적인 방법이다. 적응적인 방법을 위해서, 목표 비트 율과 출력 비트 율 간에 에러를 최소화하는 관점에서 최적의 비트 할당을 수행한다. 목표 비트 율을 충족시키기 위해서 율-왜곡 모델이 사용되고, 모델의 매개변수들을 프레임 단위로 추정하고 갱신한다. 두 종류의 비트 율 제어 방법들은 JM참조 소프트웨어에서 사용되는 비트 율 제어 방법과 비교된다. 실험결과는 제안된 방법들이 AVC의 JM참조 소프트웨어에서 사용되던 기존의 비트 율 제어 방법과 비교하여 주관적인 화질의 향상과 함께 보다 효율적으로 평균 목표 비트 율을 충족시키는 것을 보여준다.

서지기타정보

서지기타정보
청구기호 {ICU/MS09-11 2009
형태사항 vii, 53 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김창희
지도교수의 영문표기 : Mun-Churl Kim
지도교수의 한글표기 : 김문철
학위논문 학위논문(석사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 47-48
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서