서지주요정보
ADPCM 음성 부호화기의 부정합 현상 및 음질 향상에 관한 연구 = A study on mismatching phenomenon and quality enhancement in ADPCM coding of speech
서명 / 저자 ADPCM 음성 부호화기의 부정합 현상 및 음질 향상에 관한 연구 = A study on mismatching phenomenon and quality enhancement in ADPCM coding of speech / 유득수.
발행사항 [서울 : 한국과학기술원, 1985].
Online Access 제한공개(로그인 후 원문보기 가능)원문

소장정보

등록번호

4103445

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 8576

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis work, we investigate two important areas in ADPCM coding of speech : the effects of statistical mismatch in speech waveform coders and the enhancement of noisy speech. First, we investigate various mismatch phenomena in waveform coding such as the mismatch effects of probability density function (pdf) shape, signal variance, and correlation. In an adaptive system, it is shown that the mismatch effects of the pdf shape and the variance are more serious than that of correlation. In order to design a coder that matches the pdf shape, we have chosen as the quantizer model the Laplacian pdf which approximates most closely the short-term pdf of real speech. Moreover, a new algorithm updating the step size is used to match the variance of input with that of the quantizer. The newly designed ADPCM system with the pdf shape and variance matched yields an improved performance over the conventional ADPCM with a gamma quantizer by about 1.5 dB in signal-to-quantization-noise-ratio (SQNR). In addition, to have a coder that matches correlation we use a backward predictor in which the values of prediction coefficients are changed (or switched) on a block-by-block basis depending on whether the input speech is voiced, unvoiced or silence. Consequently, we have obtained the performance improvement additionally by about 1 dB in SQNR at the expense of a slight increase of coder complexity. As a result, the new ADPCM system yields about 2.5 dB of improvement in SQNR over the conventional ADPCM system. Second, we study an algorithm for enhancing noisy speech corrupted by white or colored noise. We use the Kak filtering algorithm which has simple structure. The performance of a fixed or adaptive Kak filter has compared to those of existing enhancement systems. We have found that the Kak filter yields a performance improvement that is comparable to the spectral subtraction method in enhancing noisy speech corrupted by colored noise, the improvement gain of the Kak filter is slightly less than that of the spectral subtraction method. However, since the Kak filtering algorithm is much less complex than existing enhancement algorithms and it is easier to combine with waveform coders, the Kak filter may be utilized to enhance noisy speech in waveform coding. When the Kak filter is used in a DPCM or ADPCM system, the waveform coding and enhancement of noisy speech can be done simultaneously.

파형부호화기의 subsystem들은 보통 그 시스템 입력의 통계적 특성에 가장 적합하도록 되어 있다. 그래서 실제 상황에서는 시스템 입력과 subsystem들 사이의 통계적 특성의 부정합은 피할 수 없다. 더우기 파형부호화기는 실제적으로 잡음이 있는 환경에서 동작하게 되는데 이런 조건 아래에서는 주위의 잡음이 입력신호에 섞이는 것이 보통이다. 본 논문에서는 제1부에서 음성부호화기와 그 입력사이에서 발생하는 부정합현상에 대한 연구와 제2부에서 잡음이 섞인 음질향상에 관한 연구를 하였다. 제1부에서는 음성 입력과 음성부호화기의 양자기 및 예측기 사이에서 발생하는 부정합 문제를 pdf shape의 부정합, 분산의 부정합 및 상관의 부정합 등으로 대별하여 그 현상을 규명하였다. 그 결과로 적응 시스템에서는 양자기가 입력의 pdf shape과 분산에 잘 따라 가도록 하는 것이 예측기가 입력의 상관에 잘 따라가도록 하는 것보다, 종래의 SQNR 척도로 볼때, 더 좋은 것으로 나타났다. Pdf shape 의 정합을 위해서 음성의 short-term pdf 에 가장 잘 접근하는 Laplacian pdf shape를 갖는 양자기를 사용하였다. 또한 분산의 정합을 위해서는 새로운 방식의 step size update 알고리즘을 사용하였으며, 그 결과 SQNR 척도로 약 1.5dB 정도의 개선이 있었다. 이 밖에 상관의 정합을 위하여 입력의 매 block마다 적절한 예측계수를 사용하는 스위칭 방식의 예측기를 backward 적응방식으로 이용한 결과 시스템의 복잡도를 별로 증가시키지 않고서도 SQNR 척도로 약 1dB 정도 더 개선할 수 있었다. 결과적으로 이와같은 방식을 사용할때 종래의 ADPCM 시스템에 비해서 SQNR 척도로 약2.5dB 정도 성능을 증가시킬 수 있었다. 제2부에서는 광대역 또는 협대역 잡음이 섞인 음성의 음질을 개선하는 방법에 대해서 연구하였다. 구조와 알고리즘이 비교적 간단한 Kak 필터를 고정방식과 적응방식으로 simulation하여 다른 기존의 음질향상 시스템과 비교해본 결과, 광대역 잡음이 섞인 음성의 경우에는 기존의 power spectrum subtraction 방법과 거의 비슷한 성능을 얻을 수 있었다. 이와 반면에 협대역 잡음이 섞인 음성의 경우에는 Kak 필터를 사용하였을 때의 이득이 power spectrum subtraction 방법에 의한 이득보다 약간 작았다. 그러나 Kak 필터 알고리즘의 복잡도가 기존의 다른 방법보다 훨씬 작을 뿐만아니라, Kak 필터는 파형부호화기와 쉽게 결합될 수 있으므로 파형 부호화기의 음질향상에 효과적으로 이용될 수 있다. 실제로 DPCM과 ADPCM 시스템에 Kak 필터를 응용해본 결과 잡음이 섞인 음성의 음질을 효과적으로 향상시킴과 동시에 부호화할 수 있음을 입증하였다.

서지기타정보

서지기타정보
청구기호 {MEE 8576
형태사항 vi, 104 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Deuk-Su Yoo
지도교수의 한글표기 : 은종관
지도교수의 영문표기 : Chong-Kwan Un
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 98-104
주제 Delta modulation.
Speech processing systems.
Adaptive signal processing.
Predicting theory.
Filters (Mathematics)
DPCM. --과학기술용어시소러스
음성 처리. --과학기술용어시소러스
양자화기. --과학기술용어시소러스
예측 부호화. --과학기술용어시소러스
필터링. --과학기술용어시소러스
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서