서지주요정보
Speech quality enhancement and pitch-dependent bit reduction scheme for WI coders
서명 / 저자 Speech quality enhancement and pitch-dependent bit reduction scheme for WI coders / Keun-Seok Cho.
발행사항 [대전 : 한국정보통신대학교, 2009].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0001189

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS09-42 2009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis, an improved SEW/REW decomposition method with pitchdependent phase generation and a noble variable bit rate (VBR) scheme are proposed to enhance the speech quality of the waveform interpolation (WI) coder and reduce the bit rate of the WI coder. In the original WI scheme, a characteristic waveform (CW) is decomposed into a slowly evolving waveform (SEW) and a rapidly evolving waveform (REW) in Cartesian coordinates. This may deteriorate the spectral shape of the reconstructed CWs. Especially, speech quality degradation is inevitable when the REW contains SEW components. To solve this problem, the proposed decomposition is performed in the magnitude domain to reduce spectral distortions. The phase of the characteristic waveforms is generated after classifying the signal into silence, unvoiced and voiced speech using the pitch value. The proposed VBR scheme is achieved by substituting white Gaussian noises with the excitation signal of silence and unvoiced speech and allocating bit rates variably. The performance of our proposed method was evaluated by the perceptual evaluation of speech quality (PESQ) score. The proposed CW modification results in the PESQ score improvement by 0.32 from the baseline speech quality, i.e., the PESQ score of 3.368. In addition, we confirmed that the required bit rate is decreased by 6.7% using the proposed novel VBR scheme. Experimental results show that our proposed algorithm achieves the improved speech quality while reducing the required bit rate compared to the conventional methods.

오늘날 음성 부호화기 연구의 초점은 음성 신호에 대한 정보를 낮은 비트 할당을 통해 전송하면서도 음질의 저하를 최소화 하는 데에 중점이 되고 있다. 음성 부호화기 중의 하나인 파형 보간 부호화기(Waveform Interpolation coder)는 파형의 모양과 특징 파라미터를 동시에 전송하는 복합형 코딩(Hybrid coding)기법을 사용하는 코더로 낮은 전송률에서 비교적 좋은 음질을 얻을 수 있는 장점을 지니고 있다. 이런 장점으로 디지털 무선 통신에서의 음성 부호화기뿐만 아니라 대용량 음성 데이터베이스 구축이나 소용량 음성합성기 등에 이용될 수가 있다. WI 코더는 피치주기만큼의 특징을 지울 수 있는 파형인 CW 를 SEW 와 REW 로 분리하여 각각의 파형의 특징에 따라 다른 전송률을 가지고 전송함으로써 낮은 비트율로 높은 음질을 얻을 수가 있다. WI 코더의 음질향상과 전송률을 줄이기 위한 연구는 많이 진행되어 왔다. 음질 향상을 위해 REW 의 phase 를 SEW/REW ratio 를 이용해 생성하는 방법의 관한 연구가 있었고, 전송률을 줄이기 위한 연구로는 WI 코더를 바탕으로 음성 신호를 음성의 특징에 따라 분류하고 그에 따른 가변적인 비트할당을 통해 전송률을 줄이는 source controlled variable bit-rate(SCVBR) 음성 부호화기에 관한 연구가 있었다. 기존의 WI 코더에서는 낮은 비트율을 위해 decomposition 과정에서 분리된 SEW 와 REW 의 페이즈 정보를 디코더로 전송하지 않는다. 그리고 기존의 WI 코더에서는 디코더에서 전송된 magnitude 를 가지고 SEW 에는 고정 phase 를 통해서 REW 는 랜덤 phase 를 통해 재생성 되게 된다. Phase정보의 부재와 스펙트럼상의 decomposition 으로 magnutude 가 보존되지 않아 음질의 저하가 발생한다. 기존의 WI 코더에서의 decomposition 은 CW 의 DTFS 도메인에서 수행 되어 왔고, 디코더에서 phase 를 SEW, REW 에 각각 임의로 넣어주어 합쳐서 CW 를 생성했기 때문에 음질 저하의 원인이 되었다. 이런 문제점을 해결하고 나아가 음질을 향상시키면서 비트율을 낮추기 위해 방법을 제시하였다. 기존 방식과는 달리 먼저 CW 에서 magnitude 를 구하게 됨으로써, 디코더 에서는 전송된 SEW 와 REW 의 각각의 magnitude 를 더하여 CW 의 magnitude 를 구할 수 있게 된다. 기존의 방식에서는 magnitude 가 보존 되지 못하지만 이 방법을 통해 magnitude 가 보존되어 전송될 수 있는 큰 장점을 가진다. 새로운 방식의 decomposition 을 통해 얻어진 디코더에서의 CW magnitude 정보에 phase 정보를 넣어 CW 를 복원하게 된다. 여기서phase 는 임의의 고정 phase 와 랜덤 phase 를 사용하게 되는데, 유무성음 및 무음의 구분을 통해 phase 를 복원하게 된다. 여기서, 무성음과 무음의 여기 신호는 거의 white random Gaussian noise 에 가깝다. 따라서 무성음과 무음에는 파워로 normalize 된 white random Gaussian noise 를 넣어 대체함으로써 인코더에서 여기 신호에 관한 CW 의 정보를 전송하지 않도록하여 비트율을 감소 시킬 수가 있다. 성능 평가를 위해 객관적 평가 방법인 PESQ score 측정을 실행하였다. 실험 결과 기존의 WI coder 보다 PESQ score 가 0.34 만큼 상승하였으며, 이를 통해 음질이 개선됨을 확인할 수 있었으며, 또한, VBR scheme 을 적용했을 때는, 기존의 WI coder 보다 6.7%만큼 전송률을 줄일 수가 있었다. 향후 연구계획으로는 피치 정보를 좀더 잘 검출하는 방법을 연구할 예정이며, corpus 기반의 TTS 시스템에 적용하는 방법에 대해 연구할 예정이다.

서지기타정보

서지기타정보
청구기호 {ICU/MS09-42 2009
형태사항 vii, 45 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 조근석
지도교수의 영문표기 : Min-Soo Hahn
지도교수의 한글표기 : 한민수
학위논문 학위논문(석사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 41-42
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서