서지주요정보
Pitch-synchronous 음성 파형 벡터 양자화 = Pitch-synchronous speech waveform vector quantization
서명 / 저자 Pitch-synchronous 음성 파형 벡터 양자화 = Pitch-synchronous speech waveform vector quantization / 박한춘.
발행사항 [서울 : 한국과학기술원, 1989].
Online Access 제한공개(로그인 후 원문보기 가능)원문

소장정보

등록번호

4105719

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 8927

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis work, a pitch-synchronous waveform speech coding method is proposed and its performance is studied by computer simulation. The proposed speech coding method is based on the idea that the bit rate for speech signal transmission would be reduced significantly by vector quantization of voiced speech waveforms in pitch units. For the pitch-synchronous waveform coding, the pitch period must be estimated first. Then the voiced speech waveform should segmented in pitch units. In order to segment the voiced speech in pitch units, a starting point of the pitch period must be defined. In this study, the starting point of a pitch period was defined as the zero-crossing point before the largest peak in the pitch period. After the pitch unit segmentation, the lengths of the voiced speech segments were adjusted the same as the dimension of the waveform vector quantizer(VQ) code-book. The dimension of the VQ codebook was set to be greater than the length of any pitch period in voiced speech signal. Then every segment of the voiced speech signal was interpolated to make its length equal to the dimension of the codebook. For encoding of unvoiced speech signal, the input speech signal was segmented in equal length and waveform vector quantization of the segmented speech signal was done. Therefore, two VQ codebooks were constructed for voiced speech signal and unvoiced speech signal, respectively. The voiced/unvoiced/silence detection was done by using the presence of a pitch period, an energy level, and a zero-crossing rate. Computer simulation of the proposed pitch-synchronous speech waveform VQ method was done. The gain/shape VQ method was used to construct VQ codebooks. The size of the gain codebooks for voiced/unvoiced speech was 128 for both codebooks. The size of the shape codebook for unvoiced speech was varied from 64 to 256 and the dimension of the codebook was 15(1.875 msec). The size of the shape codebook for voiced speech was varied from 64 to 512 and the dimension of the codebook was 130(16.25 msec). According to the subjective listing test, it was found that the fidelity of the output speech was increased as the size of the VQ codebook for voiced speech was increased. The average transmission rate of the proposed speech coder is about 4700 bps when the size of the VQ codebook for voiced speech is 512.

본 논문에서는 pitch-synchronous 음성 파형 부호화 방식을 제안하였으며, computer simulation을 통하여 이에 대한 성능 분석을 하였다. Pitch-synchronous 파형 부호화 방식의 목적은 음성의 유성음 부분을 전송할 때 유성음의 한 pitch 주기 단위로 파형 부호화 함으로써 전송 속도를 감소시키는 것이다. 유성음을 한 pitch 주기 단위로 파형 부호화하기 위해서는 우선 유성음의 pitch 주기를 측정한 후, 유성음을 pitch 주기 단위로 구분(segment)해야 한다. 유성음을 pitch 주기 단위로 구분하기 위해서는 pitch 주기의 시작점이 정의되어야 한다. 본 연구에서는 pitch 주기의 시작점을 유성음의 한 pitch 주기에 나타나는 peak가 시작되기 바로 전의 영 교차점으로 정의하였다. Pitch 주기의 시작점으로 부터 시작하여 뽑아낸 유성음의 한 주기 파형을 codebook에 있는 유성음의 한 주기 파형과 비교하여 distortion이 가장 작은 codeword를 찾아내기 위해서는, 뽑아낸 유성음의 한 주기 파형의 길이가 codebook의 dimension과 같아야 한다. 이를 위해서 codebook의 dimension을 충분히 크게 잡은 뒤, 뽑아낸 유성음의 한 주기 파형의 길이를 codebook의 dimension과 같아지도록 interpolation 하였다. 무성음인 경우에는 똑같은 길이 단위로 벡타 양자화 하였다. 유성음/무성음/묵음 구별은 pitch 주기의 검출 유.무와 영 교차율, 그리고 energy level에 의해 결정하였다. 벡타 양자화 방식은 gain/shape VQ를 사용하였다. 무성음과 유성음에 대한 codebook은 각각 따로 만들었는데, gain codebook의 크기는 무성음과 유성음 똑같이 128개로 하였다. 유성음의 경우에는 파형에 대한 codebook의 dimension을 130으로 하였고, codebook의 크기를 64, 128, 256, 512로 변화시켜 가면서 시험해 보았다. 무성음의 경우에는 파형에 대한 codebook의 dimension을 15로 하였고, codebook의 크기를 64, 128, 256로 변화시키며 시험하였다. Subjective 청취 실험 결과 유성음의 codebook 크기를 증가시켜 감에 따라 재생된 음질의 충실도(fidelity)가 향상되었다. 유성음의 codebook 크기를 512로 하였을 때 평균 전송 속도는 약 4700 bps 이었다.

서지기타정보

서지기타정보
청구기호 {MEE 8927
형태사항 iv, 67 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Han-Choon Park
지도교수의 한글표기 : 이황수
지도교수의 영문표기 : Hwang-Soo Lee
CRL-T-8917
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 65-66
주제 Coding theory.
Vector processing (Computer science)
Intonation (Phonetics)
벡터 양자화. --과학기술용어시소러스
보코더. --과학기술용어시소러스
Vocoder.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서