서지주요정보
Kernel PCA 를 통한 GMM 기반의 음성 변환 = GMM based voice conversion using kernel PCA
서명 / 저자 Kernel PCA 를 통한 GMM 기반의 음성 변환 = GMM based voice conversion using kernel PCA / 한준희.
저자명 한준희 ; Han, Joon-Hee
발행사항 [대전 : 한국과학기술원, 2009].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8020148

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 09033

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

이 논문은 가우시안 혼합 모델 (GMM)을 기반으로 한 새로운 음성변환 시스템에 대해 설명한다. 가우시안 혼합 모델을 통한 음성 변환 시스템은 태생적인 문제점을 가지고 있는데, 그것은 음색을 표현하는 스펙트럼 포락(spectral envelope)이 과도하게 부드러워진다는 것이다. 이러한 문제 때문에 발생하는 음성 변환 품질의 저하를 보상하는 것이 이 논문의 목적이다. 성능향상을 위해 커널을 통한 주성분 분석 기법(Kernel PCA) 를 사용하여 얻을 수 있는 장점을 이용하였다. 커널을 통한 주성분 분석 기법의 주요 특징으로는 데이터의 분포를 새로운 모양으로 변형시키는 점과 데이터 차원 수를 임의의 차원으로 바꿀 수 있다는 점이 있다. 먼저, 데이터 재분포의 특성을 이용하여 입력공간(input space)에 존재하는 원시화자의 음성 데이터를 특징공간(feature space)로 옮겨 새로운 모양의 분포를 도출하였다. 새롭게 변형된 분포는 가우시안 혼합 모델에 적합하도록 모양이 바뀌게 되었다. 가우시안 혼합 모델을 이용한 모델링 성능 향상과 관련된 것으로 원시화자의 데이터와 목적화자의 데이터 간의 매핑관계가 있다. 커널을 통한 주성분 분석 기법의 차원 확장 특징을 이용하면 두 화자 데이터 간의 매핑을 정교하게 할 수 있다. 결국, 정교해진 매핑 관계를 바탕으로 음성 변환 품질이 향상된다. 제안된 기법은 음성 데이터의 분포와 차원 수를 모두 변화시킨다. 하지만 목적화자의 데이터는 입력 공간에 존재해야 하므로 본 논문에서는 원시화자의 데이터만 변화시켰다. 실험 결과를 살펴보면 제안된 기법이 기존의 가우시안 혼합 모델을 이용한 음성 변환 시스템보다 여러 가지 실험 환경에서 높은 성능을 보여주었다.

서지기타정보

서지기타정보
청구기호 {MCS 09033
형태사항 iv, 30 p. : 삽도 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Joon-Hee Han
지도교수의 한글표기 : 오영환
지도교수의 영문표기 : Yung-Hwan Oh
수록잡지정보 : "Kernel PCA 를 이용한 GMM 기반의 음성변환". 말소리, 67호, pp.167-180(2008)
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 29-30
주제 Voice conversion;Kernel PCA;GMM;Gaussian Mixture Model;Kernel Principal Component Analysis
음성 변환;커널 피씨에이;가우시안 믹스쳐 모델;가우시안 혼합 모델;커널 주성분 분석
QR CODE qr code