서지주요정보
Complexity reduction and quality improvement of code-excited linear predictive coders = 부호여기 선형예측부호화기의 연산량 감축 및 음질 향상에 관한 연구
서명 / 저자 Complexity reduction and quality improvement of code-excited linear predictive coders = 부호여기 선형예측부호화기의 연산량 감축 및 음질 향상에 관한 연구 / Jin-Ick Lee.
발행사항 [대전 : 한국과학기술원, 1990].
Online Access 제한공개(로그인 후 원문보기 가능)원문

소장정보

등록번호

8000368

소장위치/청구기호

학술문화관(문화관) 보존서고

DEE 9011

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The main objective of this dissertation work is to develop a CELP coder that is computationally more efficient and has improved output speech quality as compared to the existing coders. To reduce the computational complexity of the CELP coder, two attempts are made. One is to use a fast codebook search method, and the other is to investigate a new low-rate SELP coder that is based on the structure of the CELP coder but does not require codebook search. As a scheme to improve the output speech quality of the CELP coder, we propose a method that performs residual shaping both at the analyzer and at the synthesizer. In CELP coding, the analysis-by-synthesis method is used to obtain highquality output speech at low-bit rates. When this method is used in connection with a large codebook, a large number of computations are required in the encoding phase. To solve this problem, we develop a computationally efficient method for codebook search in CELP coding. By combining the sparse code vector and the frequency-domain search method simultaneously, we can reduce the computational complexity to an extent that cannot be obtained by using either method separately. It has been shown that the speed-up factor of the proposed method is almost twice that of the frequency-domain search method that is so far known to be the fastest method. Since our proposed codebook search method is suboptimal, the obtained SNR value may be somewhat lower than those of the full search method. However, according to our informal listening tests, the difference in speech quality between the original search method and our proposed method is almost indistinguishable. Next, as another scheme to reduce the computational complexity of the CELP coder, we present a multi-stage SELP coder that can be used as a speech coder with low-bit rate. The multi-stage SELP coder has the form of multi-stage vector quantization, but utilizes the structure of a conventional SELP coder. The proposed multi-stage SELP coder has the output speech quality comparable to that of the multi-pulse LPC or the CELP coder, and yields satisfactory speech quality at the rate of 5840 bits/s. Its computational complexity is less than that of the conventional CELP coder, and it is easy to obtain the predictor parameters of the coder. Since the performance of the multi-stage SELP coder which has a modular structure is nearly proportional to the number of stages, we can have a trade-off between the performance and the transmission rate (and the system complexity). This multi-rate capability of the multi-stage SELP coder may be useful in digital network applications. When voice/data integration is considered, the multi-rate capability would be helpful in reducing the network congestion. Finally, as a solution to improve the speech quality of the CELP coder, we propose a pre- and post-processing residual shaping method. This method preserves the post-filtering advantage (i.e., the noise-masking effect), and thus yields much less signal distortion and little amplitude fluctuation. When the CELP coder is not used as a tandeming coder, either the post-filtering or residual shaping method can effectively be used to improve the output speech quality. However, when the CELP coders are tandemed, both methods can deteriorate the output speech quality. For this reason, our proposed residual shaping method is advantageous in that the performance degradation is minimal when the coders are cascaded. By simulation, we show that for each stage of tandeming the CELP coder with the proposed residual shaping method performs better than that without residual shaping.

본 논문에서 다루고 있는 문제는 기존의 CELP coder에 비하여 연산량이 적고, 음질이 우수한 새로운 CELP coder 알고리즘의 개발이다. CELP coder의 연산량을 줄이기 위하여 두가지 방법을 제시하였는데, 하나는 속도가 빠른 codebook search 방법이며, 다른 하나는 CELP coder의 기본 구조를 따르면서도 codebook search가 필요없는 새로운 저전송속도 음성부호화기인 SELP coder이다. CELP coder의 음질을 향상시키기 위한 방법으로 송신단 및 수신단 모두에서 residual shaping을 하는 방법을 제시하였다. CELP coding에서는 저전송속도에서 고품질의 음질을 얻기 위하여 analysis-by-synthesis 방법을 사용하고 있는데, 이 방법을 길이가 긴 codebook과 함께 사용할 때에는 encoding 단계에서 많은 연산량이 필요하게 된다. 이 문제를 해결하기 위하여 CELP coder에서 codebook 을 search할 때 계산이 효율적인 방법을 개발하였다. Sparse code vector와 주파수 영역에서의 codebook search를 함께 사용해서, 이 방법들을 각각 사용했을때 보다 전체계산량을 훨씬 줄일수 있었다. 제안된 방법은 지금까지 알려진 codebook search 방법들 중에서 가장 속도가 빠른 주파수 영역 codebook search 방법보다 약 2배 정도 더 빠르다. 제안된 codebook search방법은 suboptimal하기 때문에 SNR값이 다른 full search 방법들에 비하여 약간 떨어진다. 그러나, 비공식적인 듣기시험에서 제안된 방법과 다른 full search 방법들 사이에 음질의 차이가 없음을 확인하였다. 두번째로 CELP coder의 연산량을 줄이는 또다른 방법으로 저전송속도의 음성부호화기로 사용할수 있는 다단-SELP coder를 제시하였다. 다단-SELP coder는 다단-vector 양자화의 한형태를 지니고 있으나, 기존의 SELP coder의 구조를 이용한다는 차이점을 지니고 있으며 적응 codebook을 가진 CELP coder로 볼수있다. 제안된 다단-SELP coder는 multi-pulse LPC나 기존의 CELP coder등과 대등한 음질을 지니고 있으며 5840 bits/s에서 만족할만한 음질을 얻을 수 있다. 이 방법의 연산량은 기존의 CELP coder에 비하여 적으며, coder의 predictor계수를 구하기도 용이하다. 다단-SELP coder의 구조가 modular하며, 성능이 대체로 coder의 단수에 비례하므로 성능과 전송속도 (또는 system의 복잡도) 사이에 trade-off가 있다. 따라서 다단-SELP coder의 이러한 다전송속도 능력은 digital network 응용에 유용하다. Voice와 data가 집적될때 다전송속도 능력은 network의 congestion을 줄이는데 효과적으로 사용될 수 있다. 마지막으로 CELP coder의 음질을 향상시키기 위하여 송신단 및 수신단 양쪽에서 residual shaping을 해주는 방법을 제시하였다. 이 방법은 postfiltering의 장점 (noise-masking 효과)을 유지하면서도 postfiltering이나 수신단에서의 residual shaping에 비하여 신호의 왜곡과 amplitude의 변동이 적다. CELP coder가 tandeming되지 않을 때에는 postfiltering이나 수신단에서의 residual shaping도 음질을 개선하는데 효과적으로 사용될수 있으나, CELP coder가 tandeming 될 때에는 두 방법 모두 음질을 크게 악화시키게 된다. 그러나 제안된 방법은 CELP coder가 tandeming되었을 때에도 음질악화가 적은 장점이 있다. Computer simulation에 의해서 CELP coder가 tandeming될 때, 제안된 residual shaping 방법을 사용한 CELP coder가 사용하지 않았을 때에 비하여 음질저하가 적음을 보였다.

서지기타정보

서지기타정보
청구기호 {DEE 9011
형태사항 ix, 118 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이진익
지도교수의 영문표기 : Chong-Kwan Un
지도교수의 한글표기 : 은종관
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학과,
서지주기 Reference : p. 108-116
주제 Speech processing systems.
Sparse matrices.
Predictive control.
예측 부호화. --과학기술용어시소러스
음성 처리. --과학기술용어시소러스
부호기. --과학기술용어시소러스
전송 속도. --과학기술용어시소러스
Vocoder.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서