서지주요정보
(A) performance study of speech bandwidth compression systems = 음성 대역폭 축소 시스템의 성능에 관한 연구
서명 / 저자 (A) performance study of speech bandwidth compression systems = 음성 대역폭 축소 시스템의 성능에 관한 연구 / Hwang-Soo Lee.
발행사항 [서울 : 한국과학기술원, 1983].
Online Access 원문보기 원문인쇄

소장정보

등록번호

4101942

소장위치/청구기호

학술문화관(문화관) 보존서고

DEE 8302

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this dissertation, the performances of speech bandwidth compression systems have been studied, and new results have been obtained in four areas that attract recent research interests. The speech bandwidth compression systems chosen for performance study are pulse code modulation (PCM), differential PCM(DPCM), delta modulation (DM), their adaptive versions (i.e., adaptive PCM(APCM), adaptive DPCM (ADPCM) and adaptive DM(ADM), and the generalized residual-excited linear predictive (RELP) coder. First, the performances of APCM, ADPCM and ADM systems have been compared at the bit rate of 32 kbits/s using conventional signal-to-quantization noise ratio (SQNR) and segmented SQNR($SQNR_{SEG}$) as performance criteria. In APCM and ADPCM, both the instantaneously and syllabically companding methods are applied to each uniform or nonuniform quantizer. For ADM systems, three representative ADM systems have been considered. They are continuously variable slope DM(CVSD), constant factor DM (CFDM) and hybrid companding DM(HCDM). Among these waveform coders, the performance of HDCM is superior to other coders. The performance cross-over between ADPCM and ADM systems occurs at the bit rate slightly above 32 kbits/s. Therefore, the use of ADM systems (particularly HCDM system) at the transmission rate of 32kbits/s or below is preferred to ADPCM. Second, analytical studies on the performances of waveform coders have been done. New results for the frequency domain modeling of waveform coders have been obtained. These models are obtained based on the overload characteristics of each waveform coder in the frequency domain. The overload characteristics are determined by two threshold levels which can decide the coder in one of three operating regions: overload region, granular region and the region below the threshold of coding. The performances of waveform coders are then predicted by using their corresponding frequency domain models with real speech. Close agreements between the theoretical prediction of waveform coder performance and the actual performance of the corresponding coder have been obtained. The quantizer bounds of APCM, ADPCM and ADM systems have also been obtained. These bounds are found to be slightly higher than the performances that can be achieved by these coders. Third, the performances of the speech waveform coders that incorporate noise spectral shaping have been obtained with real speech over a wide dynamic range. The noise spectral shaping of each coder has been done by using a noise feedback filter in its feedback path. Two types of noise spectral shaping methods are used to shape the spectral components of quantization noise at the decoder output: one for APCM and ADPCM, the other for ADM. For APCM and ADPCM, the noise feedback filter is designed to minimize the C-message weighted quantization noise power. As for ADM, the noise feedback filter is used to move some portion of inband noise outside the signal band. The performance criteria used for these coders are frequency-weighted SQNR(FWSQNR) and segmental FWSQNR($FWSQNR_{SEG}$) for APCM and ADPCM, and SQNR and $SQNR_{SEG}$ for ADM. A method to design a stable noise feedback filter has been newly proposed. In this method a filter is obtained by analyzing the filtered Gaussian sequence using the autocorrelation linear predictive coding (LPC) method. Simulation results with real speech input show that the improvements of the performances of these waveform coders are above the difference limen (i.e., about 0.5 to 1.5 dB) of the quantization noise. Finally, a generalized RELP coding structure has been newly proposed. The coder structure is devised based on the RELP vocoder and the adaptive predictive coding (APC) system. This coder can encode input speech signal at a wide range of bit rates covering 4.8 to 18 kbits/s by varying only the residual encoder and decoder according to the output bit rate. Above 1 bit/sample for residual quantization, two types of generalized RELP coders called the RELP-I and the RELP-II have been studied. The RELP-II coder is designed functionally equivalent to APC. But, the RELP-I coder directly quantizes the linear prediction residual. Thus the resulting output of the RELP-I coder contains the spectrally shaped quantization noise according to input speech spectra. The simulation results show that the performance of the RELP-II coder is better than that of the RELP-I coder for a 1-bit residual quantizer. With a 2-bit residual quantizer the RELP-I coder results in subjectively more pleasing sounds than the RELP-II coder.

음성대역폭축소시스템으로 가장 널리 쓰이고 있는 음성파형부호화기의 성능에 관하여 다음 네 가지 측면에서 연구되었다. 첫째로 최근에 관심이 집중되고 있는 전송속도 32 kbits/s 에서의 음성파형부호화기들의 성능이 비교 검토되었다. 이때 사용된 음성 부호화기들은 adaptive pulse code modulation (APCM), adaptive differential PCM (ADPCM) 과 adaptive delta modulation(ADM) 방식 들이며 각각의 부호화기에 대하여 순시 압신, syllabic압신 또는 이 두가지 압신방법의 혼합된 형태인 hybrid압신방법들이 적용되었다. 특히 APCM 과 ADPCM 부호화기에 대하여는 선형양자화기 뿐만 아니라 입력신호의 통계적 특성에 맞는 비선형양자화기들도 사용하여 그 성능을 높일 수 있도록 하였다. 실제의 음성신호를 사 용한 컴퓨터 simulation의 결과에 의하면 입력신호대잡음비 또는 segmented 입력신호대잡음비를 성능의 판별기준으로 삼을 경우 ADM 방식의 일종인 hybrid companding DM (HCDM) 이 가장 우수한 성능을 가진 것으로 판명되었다. 뿐만 아니라 ADPCM 시스템과 ADM 시스템사이에서의 성능의 교차점이 32 kbits/s 보다 높은 전송속도에 있는 것이 발견되었으며 때문에 전송속도가 32 kbits/s 이하에서는 음성부호화기로 ADM 시스템(특히 HCDM 시스템)을 사용하는 것이 유리하다. 둘째로 음성파형부호화기 (PCM, DPCM, DM, APCM, ADPCM 과 ADM)들 의 성능에 대한 해석적인 방법이 연구되었다. 각 부호화기의 주파수 영역에서의 overload 특성들을 기초로 하여 새로운 주파수 영역에서 의 각 부호화기의 modeling 방법이 제시되었다. 이와같은 주파수영역에서의 model 을 통하여 각 부호화기의 양자화 잡음에 대한 성능을 예측하고 그 이론적인 예측치와 실제의 부호화기와의 성능을 실제의 음성 신호를 사용하여 비교하였다. 각 부호화기에 대하여 이론적인 예측치와 실제의 성능 사이에 상당히 근사한 결과를 얻었으며 이 주파수영역에서의 음성파형부호화기들의 model을 통하여APCM, ADPCM 과 ADM시스템의 quantizer bound 를 구하였다. 세째로 음성파형부호화기(APCM, ADPCM 과 ADM) 들에 noise spectral shaping 의 방법을 적용하여 그 성능을 높이는 방법이 연구되었다. 양자화잡음 궤환여파기 (noise feedback filter)를 각 부호화기의 궤환회로에 사용하는 noise spectral shaping 방법에 대하여 연구되었으며 음성파형부호화기의 특성에 따라 두가지 종류의 noise spectral shaping방법이 연구검토 되었다. 그 한 방법은 APCM 과 ADPCM에 적용할 수 있는 방법으로 음성신호대역내에서의 잡음의 주파수 성분을 변형시켜 subjective하게 듣기 좋은 음질을 내게하는 방법 이다. 이 때의 잡음 궤환여파기는 C-message weighting한 양자화잡음을 최소로 하도록 설계되었다. 또 다른 한 방법은 표본화주파수 (sampling frequency) 가 입력신호의 Nyquist rate보다 여러 배 이상 높은 ADM 시스템에 적용하기 위한 것으로 이 때의 잡음궤환여파기는 입력신호주파수대역내에 있는 양자화잡음을 그 대역 밖으로 재 배치하는 역할을 하도록 하여 그 결과로 수신기의 저역여파기를 통과한 출력신호에서의 양자화잡음의 양을 현저히 줄어 들게 하는 방법이다. 이와같은 잡음궤환여파기를 안정성이 보장되도록 설계 할 수 있는 새로운 방법이 제시되었으며 이 방법으로 설계된 잡음궤환여파기를 각 음성파형부호화기에 적용하여 noise spectral shaping을 수행하였다. 실제의 음성신호를 사용한 simulation 을 통하여 각 부호화기의 성능이 양자화잡음의 difference limen(약 0.5 - 1.5 dB)을 넘는 정도로 향상되는 결과를 얻었다. 마지막으로 4.8 - 18 kbits/s의 전송속도범위에서 유용하게 사용 될 수 있는 generalized residual-excited linear predictive(RELP) 부호화기의 구조를 제안하고 그 성능에 대하여 연구되었다. 이 generalized RELP 부호화기는 낮은 전송속도에서의 보통의 RELP부호화기와 비교적 높은 전송속도에서의 adaptive predictive coder (APC) 의 구조를 기본으로 하여 제안되었으므로 그 음질이 우수하다. Generalized RELP부호화기의 구조로 RELP-I 과 RELP-II의 두 가지 형태의 부호화기가 제안되었으며 1 bit/sample 또는 2 bit/sample인 residual신호의 양자화기를 사용하였을 때의 성능이 비교검토되었다. 실제의 음성입력신호를 사용한 simulation 의 결과로는 1 bit/sample의 residual양자화기를 사용하였을 경우는 RELP-II 부호화기가 2 bit/sample의 residual양자화기를 사용하였을 경우는 RELP-I부호화기가 더 나은 성능을 갖는 것으로 판명되었다. 이 새로이 제안된 generalized RELP 부호화기의 응용으로 2bit/sample residual 양자화기를 사용한 RELP-I부호화기의 구조로 개발된 digital자동 음성응답장치에 대하여 간략히 기술하였다.

서지기타정보

서지기타정보
청구기호 {DEE 8302
형태사항 xiii, 217 p. : 삽화 ; 26 cm
언어 영어
일반주기 Appendix : A. - B, Derivation of overload characteristics in DPCM and DM. - C, Derivation of the threshold of coding in DPCM and DM. - D, Design of a noise feedback filter (MMSE Design)
저자명의 한글표기 : 이황수
지도교수의 영문표기 : Chong-Kwan Un
지도교수의 한글표기 : 은종관
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학과,
서지주기 Reference : p. 201-216
주제 Vocoder.
Prediction theory.
DPCM. --과학기술용어시소러스
델타 변조. --과학기술용어시소러스
협대역. --과학기술용어시소러스
보코더. --과학기술용어시소러스
양자화 잡음. --과학기술용어시소러스
Pulse-code modulation
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서