서지주요정보
Band-width expansion using spline codebook-based spectral folding and shifting = Spline codebook 기반의 spectral folding 과 shifting 을 이용한 대역폭 확장
서명 / 저자 Band-width expansion using spline codebook-based spectral folding and shifting = Spline codebook 기반의 spectral folding 과 shifting 을 이용한 대역폭 확장 / Ji-Hoon Park.
발행사항 [대전 : 한국정보통신대학교, 2007].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000917

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS07-84 2007

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

A narrow-band (0 ~ 4 kHz) speech has muffled sound and less sufficient intelligibility. So its quality is low compared with wide-band speech because of the deficiency of high-band components. For the quality enhancement of narrow-band speech, band-width expansion methods can be useful. They use the characteristics such as the spectrum envelope and the excitation signal of narrow-band speech for the estimation of its high-frequency components. In this thesis, a spline codebook-based spectral folding (SCSF) method is proposed. The SCSF method simultaneously performs the high-band spectral envelope estimation and excitation signal generation. In training, the cepstrum codebook for spectrum-folded speech is generated by the vector quantization (VQ) of the extracted cepstrum. The spline codebook is made with the cepstrum codebook and the corresponding splines. In restoring narrow-band speech, the spline for the input speech is decided using the cepstral VQ and its corresponding spline function. Finally, the wide-band speech is generated by applying the spline to spectrumfolded speech. The expanded speech by the SCSF method shows better quality than other methods. However, the expanded speech by the SCSF has the problem of the high-band harmonics, because the strong pitch components in low frequency bands is folded to high frequency bands during the process. To improve the SCSF method, this thesis proposes a spline codebook-based spectral shifting (SCSS) method. The SCSS is similar to the SCSF. But, the spectral shifting method in the SCSS method is used to generate the excitation signal. The spectral shifting method generates the high-band excitation signal by shifting the low-band one using a cosine function generator. The expanded speech by the SCSS method obtains the highest score in our objective tests. In addition, listeners also prefer the expanded speech by the SCSS to those by other methods.

협대역 (0 ~ 4 kHz) 음성은 일반적으로 광대역 (0 ~ 8 kHz) 음성에 비해 억눌린 듯한 음질과 명료도와 자연성이 크게 떨어진 음질 특성을 갖는다. 협대역 음성의 음질을 향상시키고자 대역폭 확장 방법이 연구되어 왔다. 대역폭 확장 방법은 협대역 음성에서 광대역 음성으로 대역폭을 확장 시키는 방법으로 협대역 음성을 분석하여 고주파 대역의 성분을 추정, 복원하는 방법이다. Post-processor 로써 음성 통신 시스템에서 대역폭 확장 방법을 수행한다면 수신자는 협대역 음성 보다 향상된 음질을 들을 수 있다. 대역폭 확장 방법은 크게 스펙트럼 포락선 추정과 여기 신호 생성의 두 단계로 수행 나누어진다. Spline 과 spectral folding 을 이용한 ABE (Artificial Band-width Expansion) 방법은 스펙트럼 포락선 추정과 여기 신호 생성을 동시에 수행하여 대역폭을 확장 하는 방법이다. 하지만 ABE 방법은 음성을 유성음과 무성음 두 가지 경우로만 분류 함으로써 다양한 경우의 음성 특징을 만족하지 못하는 문제점이 있다. 본 논문에서는 ABE 방법의 문제점을 해결하고자 켑스트럼 벡터 양자화를 통해 spline 모양을 세분화 하는 spline 코드북 기반의 spectral folding (SCSF) 방법을 제안한다. 훈련 과정에서 spectral folded 음성으로부터 추출된 켑스트럼 계수를 벡터 양자화 훈련을 시켜 켑스트럼 코드북을 만든다. 켑스트럼 코드북의 각 코드워드들과 연관성이 큰 spline 을 모아 spline 코드북을 만들게 된다. 복원 과정에서는 훈련 과정에서 만들어진 켑스트럼 코드북과 spline 코드북을 사용해서 대역폭 확장을 수행하게 된다. 성능 평가는 SCSF 방법으로 복원된 음성과 ABE 방법으로 복원된 음성에 대하여 객관적 평가 방법인 PESQ (Perceptual Evaluation of Speech Quality)와 주관적 평가 방법인 MOS (Mean Opinion Score)를 수행하였다. SCSF 방법으로 확장된 음성의 성능평가 결과가 ABE 방법으로 확장된 음성보다 PESQ 는 0.36, MOS는 0.5 점 높게 평가 되었다. 이 결과로부터 SCSF 방법이 ABE 방법의 문제점을 해결하고 성능 향상을 가져왔음을 확인 할 수 있다. 하지만 spectral folding 방법의 특성상 고대역에 나타나는 하모닉 성분은 여기 신호 생성 측면에서 문제점으로 남아있다. 본 논문에서는 SCSF 방법의 문제점을 해결하고자 spline 코드북 기반의 spectral shifting (SCSS) 방법을 제안하였다. 스펙트럼 포락선 추정 방법은 SCSF 에서 사용한 spline 과 spectral folding 방법을 사용 하였다. Spectral folding 을 통해 여기신호도 생성했던 SCSF 방법과는 달리 spectral shifting 방법을 사용하여 여기 신호를 생성 하게 된다. Spectral shifting 방법은 cosine 함수의 특징을 이용하여 저대역의 여기 신호를 고대역으로 이동시키는 방법이다. PESQ 와 MOS 를 SCSS 로 확장된 음성에 대하여 수행하였다. SCSS 로 화장된 음성의 PESQ 와 MOS 결과가 기존의 방법으로 확장된 음성보다 높은 점수를 보여주었다. 이 결과에서 SCSS 방법이SCSF 의 문제점을 해결하고 성능 향상을 가져왔음을 확인 할 수 있었다.

서지기타정보

서지기타정보
청구기호 {ICU/MS07-84 2007
형태사항 viii, 46 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 박지훈
지도교수의 영문표기 : Min-Soo Hahn
지도교수의 한글표기 : 한민수
학위논문 학위논문(석사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 43
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서