서지주요정보
On improving the performance of low bit-rate CELP-type speech coder = 저 전송율 CELP형 음성 부호화기의 성능 향상에 관한 연구
서명 / 저자 On improving the performance of low bit-rate CELP-type speech coder = 저 전송율 CELP형 음성 부호화기의 성능 향상에 관한 연구 / Yun-Keun Lee.
발행사항 [대전 : 한국과학기술원, 1998].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8009301

소장위치/청구기호

학술문화관(문화관) 보존서고

DICE 98002

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

등록번호

9005110

소장위치/청구기호

서울 학위논문 서가

DICE 98002 c. 2

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Low bit-rate speech coding has wide applications in communication systems. The applications include narrow-band cellular radio system, memory-efficient systems for voice response and voice mail. This dissertation focuses on three major issues in a low bit-rate CELP-type speech coder: efficient encoding of spectral information and excitation codebook, robust speech decoding. The main contributions of the dissertation are as follows. First, we propose two dimensional multiple type frame segmentation (2D-MTFS) method which allows various types of two-dimensional segmentation of speech frames to save the transmission bits for LSP parameters without increasing the spectral distortion. The conventional coding method of LSP parameters generate redundant spectral information or spectral distortion by fixed update rate of LSP parameters independent of the order of coefficients and phonetic context. The intra-frame spectral distortion (IFSD) is defined to measure the spectral distortion of the reconstructed spectrum. Split VQ is designed for the quantization of LSP parameters. Second, we propose partial algebraic codebook (PAC) for the efficient encoding of excitation code. The ACELP coder which has been proposed for efficient computation of excitation codebook search consumes a large amount of bits to encode all non-zero excitation pulses separately. The VQ of pulse positions and signs which have some correlations with each other can reduce the bits required for encoding the excitation codevectors. This means using the PAC instead of the full set of algebraic codebook. The iterative training algorithm to obtain the optimal PAC is proposed. The PAC also makes it easy to vary the transmission bit rate of ACELP type coder dynamically. Finally, we propose the channel adaptive parameter estimation (CAPE) which matches the estimator to the non-stationary channel characteristics. We discussed the parameter estimation schemes using a posteriori probability and demonstrated that the mismatch of the designed channel BER of the estimator to the actual channel BER degrades the performance of the estimator. We derived equations of mean value of MAPs in terms of the designed channel BER of the estimator and the actual channel BER. The channel BER of current frame is estimated using short time average of the MAPs. The estimator adapts to the channel characteristics in a few seconds using the estimated channel BER. The proposed scheme when applied to the LSP parameter estimation performed better than the conventional estimator which do not adapt to the channel characteristics.

저 전송율 음성 부호화 방식은 통신 시스템에 많이 적용되고 있다. 예를 들면, 협대역 셀룰러 무선 시스템, 메모리 절약형 음성 응답 시스템과 음성 사서함 등이 있다. 이 논문은 저 전송율 CELP형 음성 부호화기의 세가지 주요한 주제, 즉 스펙트럼 정보 및 여기 신호의 효율적인 부호화, 그리고 강건한 음성 복호화에 대하여 초점을 맞추었다. 본 논문의 주요 내용은 다음과 같다. 첫째, 이차원 다중 형태 프레임 분할(2D-MTFS) 방법을 제안하였다. 제안된 방법은 음성 프레임을 여러 가지 형태의 이차원 분할을 하여 스펙트럼 왜곡을 증가시키지 않고 LSP 계수 전송에 필요한 비트 수를 줄인다. 기존의 LSP 계수 부호화 방식은 계수의 차수와 음소 환경에 관계 없이 일정한 갱신율을 가지고 있으므로 불필요한 정보를 전송하거나 스펙트럼 왜곡을 발생시킨다. 복원된 스펙트럼의 왜곡을 측정하기 위해서 프레임 내 스펙트럼 왜곡(IFSD)을 정의하였다. LSP 계수를 양자화하기 위해서 분할 벡터 양자화기를 설계하였다. 둘째, 효율적인 여기 신호 부호화를 위해서 부분 대수 코드북(PAC)을 제안하였다. 여기 신호 코드북 검색 시간을 단축하기 위해 제안된 ACELP 부호화기는 각각의 non-zero 펄스의 위치와 부호를 독립적으로 부호화 하기 때문에 많은 양의 전송 비트를 필요로 한다. 그러므로 서로 상관성을 갖는 non-zero 펄스들의 위치와 부호를 벡터 양자화를 하면 부호화에 필요한 비트 수를 감소시킬 수 있다. 즉, 전체 대수 코드북 대신 PAC를 이용하면 된다. 최적의 PAC를 얻기 위한 훈련 알고리즘이 제안되었다. 또한, PAC는 ACELP 형태의 부호화기의 전송율을 여러 가지로 변화시키는데 용이하다. 마지막으로, 선로 적응 계수 예측(CAPE) 방법을 제안하였다. 제안된 방법은 계수 예측기를 non-stationary 선로 특성에 적응 시킨다. 관측 사후 확률을 이용한 계수 예측기에 대해 살펴 보았으며 이러한 예측기는 설계시 가정한 선로의 비트 오차율(BER)과 실제 선로의 BER이 일치하지 않을 때 성능 저하가 생긴다는 것을 보였다. 최대 관측 사후 확률(MAP)의 평균값을 선로의 BER과 예측기 설계시 가정한 BER의 식으로 나타냈다. 현재 프레임의 선로 BER 은 MAP의 단구간 평균값으로 예측된다. 제안된 계수 예측기는 예측된 선로 BER에 의해 수초 내에 선로 특성에 적응한다. 제안된 방법을 LSP 계수 예측에 적용해 본 결과 적응 기능이 없는 기존의 예측기에 비하여 좋은 성능을 나타냈다.

서지기타정보

서지기타정보
청구기호 {DICE 98002
형태사항 ix, 128 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이윤근
지도교수의 영문표기 : Hwang-Soo Lee
지도교수의 한글표기 : 이황수
수록잡지명 : "Spectrum quantization using two-dimensional multiple type frame segmentation". Electronics Letters. Institution of Electrical Engineers Publishing, vol. 34, no. 1, pp. 41-42
학위논문 학위논문(박사) - 한국과학기술원 : 정보및통신공학과,
서지주기 Reference : p. 123-128
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서