서지주요정보
한국어 롬바드 음성의 특징 분석 및 음소 의존적인 켑스트럴 특징과 피치 정보를 이용한 롬바드 효과 보상 방법 = Analysis and compensation of Korean Lombard speech based on phoneme dependent cepstral characteristic and pitch information
서명 / 저자 한국어 롬바드 음성의 특징 분석 및 음소 의존적인 켑스트럴 특징과 피치 정보를 이용한 롬바드 효과 보상 방법 = Analysis and compensation of Korean Lombard speech based on phoneme dependent cepstral characteristic and pitch information / 박소영.
발행사항 [대전 : 한국과학기술원, 2006].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8017408

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 06030

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The performance of automatic speech recognition (ASR) system is seriously degraded by Lombard effect. The Lombard effect is caused by the articulatory changes made by speakers in order to be more intelligible in the noisy environment. A number of researches have been performed in order to analyze and compensate Lombard effect, and they can be classified into three general areas: 1) robust feature methods, 2) Lombard effect equalization methods, and 3) model transformation methods. The purpose of this paper is to analyze and compensate the acoustic characteristics of Korean Lombard speech in phoneme level. HMM mean parameters of cepstral components are transformed by estimating the Lombard compensation filter-bank for each phoneme in extracting mel-frequency cepstral coefficients (MFCC). Furthermore, it is observed that the pitch information is much affected in case of Lombard speech ; therefore, the pitch information as well as the cepstral components is used as input feature and adapted for the Lombard environment. Finally, model transformation per each phoneme, pitch-related feature, and pitch adaptation are incorporated into ASR system. The experimental results show that the performance of the proposed system is improved.

음성 인식 분야에서는 성능이 롬바드 효과로 인해 크게 저하된다는 문제점이 있다. 롬바드 효과는 화자가 잡음이 있는 환경에서 말을 하게 되면 자신의 뜻을 보다 명백하게 전달하기 위해 말하는 경향을 달리하게 되는데 이 때 나타나는 조음상의 변화를 말한다. 지금까지 롬바드 효과를 분석하고 보상하기 위한 많은 연구가 있어왔다. 롬바드 효과 보상 방법은 크게 1)강인한 특징 추출 방법, 2)롬바드 효과 변환 방법, 3)모델 변환 방법으로 분류할 수 있다. 본 논문에서는 한국어 롬바드 음성을 음소 단위로 분석하고 보상하였다. MFCC 특징을 추출하는 과정에서 각 음소별로 롬바드 효과 보상 필터뱅크를 추정하고 적용하여 켑스트럴 요소의 HMM 평균 파라미터를 변환하는 방법을 제안한다. 또한 피치가 롬바드 효과로 인해 크게 영향을 받는다는 분석 결과를 기반으로 기존의 켑스트럴 요소에 피치 정보를 추가한 특징을 롬바드 음성 인식에 사용하고 적응하는 보상 방법을 제안한다. 마지막으로 음소별 모델 변환 방법, 피치 관련 특징 사용, 피치 적응 방법을 모두 적용하여 롬바드 효과를 최대한 보상하고자 한다. 실험 결과를 통해 제안하는 방법으로 롬바드 음성에 대한 인식률을 향상시킬 수 있음을 확인한다.

서지기타정보

서지기타정보
청구기호 {MEE 06030
형태사항 vi, 43 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : So-Young Park
지도교수의 한글표기 : 김성대
지도교수의 영문표기 : Seong-Dae Kim
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학전공,
서지주기 참고문헌 : p. 41-43
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서