Noise-robust speech recognition based on missing data recognition = 손실 데이터 인식에 기초한 강인한 음성인식
서명 / 저자 Noise-robust speech recognition based on missing data recognition = 손실 데이터 인식에 기초한 강인한 음성인식 / Sung-Jun An.
발행사항 [대전 : 한국과학기술원, 2004].
Online Access 원문보기 원문인쇄





학술문화관(문화관) 보존서고

MMA 04018

휴대폰 전송







For several decades, many researchers have studied and proposed algorithms for robust speech recognition so that a speech recognition system be utilized not only in laboratory environment but also in real noisy environment. In general, the robustness is defined as a characteristic of recognition systems that they are less sensitive to adverse conditions even when they are trained in clean ones. But many problems exists in robust speech recognition. So, it is very difficult to make the robust speech recognition system. The goal of our work is to make the robust speech recognition system. To do this, we use Two methodology. Firstly, we use CDHMM(Continuous Density Hidden Markov Model). Hidden Markov Models(HMMs) are stochastic automata used to represent the distribution of stochastic process. The HMMs are very useful and widely used in speech recognition. Because mathematical formalism defining the HMMs is well known and automatic procedures are available to train the models. Secondly we use a ``Marginalization`` among various methods to treat the missing data. A marginalization method is used for processing missing data since it can be implemented with low complexity when applied to recognition system. And we also use ``Bounded marginalization`` for the advance in speech recognition. The measure selected for the detection is the local signal to noise ratio (SNR). To detect the present features needs an estimate of the local SNR from the noisy features │Y(w,t)│ and from the noise features │N(w,t)│. This estimate of the local SNR is then used to divide features into present and missing by the use of thresholding. To test the validate of propose methods, we experiment the performance of speech recognition by AURORA2.0 database, which has been used widely in the field of speech recognition task. In this thesis, we use only four types of noise in it. In this study, we proposed a new framework using missing data technique for robust speech recognition and evaluated our approach through successive experiments. From the experimental results, the proposed missing data techniques showed better performance in noisy condition. The missing data technique was motivated by human auditory perception, and many related techniques are being adapted to the speech recognition.

최근 수년 동안 실험실 수준의 음성인식 시스템을 실제 환경에서 그 정도의 수준으로 동작하도록 하는 잡음에 강인한 음성인식 방법들이 많이 연구되어 왔다. 일반적으로 음성 인식에서의 강인함이란 미리 학습된 인식모델을 여러가지 실제 사용 환경의 차이에 덜 민감하도록 하는 것을 의미한다. 하지만, 여러가지 문제들, 특히 여러 종류의 잡음 등, 실제 사용되는 상황에서는 그 강인함이 떨어져 상용화 시키는 수준까지 음성인식 시스템을 만들어 내는 데에는 큰 어려움이 있다. 본 연구의 목표는 음성인식기를 잡음 환경에 강인하게 만드는 것이다. 이를 위해 우리는 두 가지 방법론을 사용했다. 첫째는, 통계적 정합 방법의 하나인 연속밀도 은닉 마르코프 모델(Continuous Density Hidden Markov Model : CDHMM)을 사용한 것인데, 이는 출력 확률 밀도인 연속 Gaussian 확률밀도 함수에 쉽게 적용 될 수 있다는 장점을 가지고 있으며, 수학적 모델링이나, 그 과정의 자동화가 쉽다는 장점이 있다. 둘째는, 통계 수학 분야에서 널리 쓰이는 손실 데이터 이론을 위의 CDHMM과 함께 음성인식에 적용시켰다. 이것은 여러 가지 주변 상황에 따라 손실이 발생하는 상황에서도 높은 인식률을 유지하는데 도움을 준다. 손실 데이터를 처리하는 여러 방법들 중 우리는 계산량이 적고 인식기에 적용이 쉬운 주변화(Marginalization) 방법을 채택하였으며, 거기서 한걸음 더 나아가 한정 주변화(Bounded Marginalization) 방법도 살펴 보았다. 특징 벡터의 특정 차수나 시간 열의 손실 여부의 검출을 위한 방법으로는 음성 신호의 에너지와 주위 배경 잡음의 에너지의 비가 임계값(Threshold) 보다 작게 되는 부분을 찾는 기존의 방법을 이용하였다. 제안된 방법의 유효성을 검증하기 위하여 음성인식 실험에서 널리 사용되는 AURORA2.0 데이터베이스를 사용 하였는데, 그 중에 4가지 noise type에 대해 인식 실험을 수행하였다. 본 연구에서는 잡음에 강인한 음성 인식을 위하여 손실 데이터 이론을 사용하는 음성인식 시스템을 구성하였으며, 많은 실험을 통해 제안된 방법들의 유효성을 평가하였다. 손실데이터 이론을 적용한 강인한 음성 인식 방법은 사람의 청각적 지각에 관한 연구에서 그 동기를 얻었으며, 이에 연관된 많은 연구들이 음성 기술에 적용되고 있다.


청구기호 {MMA 04018
형태사항 v, 33 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 안성준
지도교수의 영문표기 : Rhee-Man Kil
지도교수의 한글표기 : 길이만
학위논문 학위논문(석사) - 한국과학기술원 : 응용수학전공,
서지주기 Reference : p. 32-33





이 주제의 인기대출도서