서지주요정보
Independent component analysis models of monaural and binaural processing for blind dereverberation under noises = 잡음하 암묵 반향 제거를 위한 한쪽 귀 및 양 귀 처리의 독립 요소 분석 모델
서명 / 저자 Independent component analysis models of monaural and binaural processing for blind dereverberation under noises = 잡음하 암묵 반향 제거를 위한 한쪽 귀 및 양 귀 처리의 독립 요소 분석 모델 / Jong-Hwan Lee.
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8016589

소장위치/청구기호

학술문화관(문화관) 보존서고

DEE 05029

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

Automatic speech recognition(ASR) is not widely used for real-world applications and has many limitations. One of the main reason for this recognition performance degradation is because of the convolutional channel in the real world. Especially inside a room, room reverberation severely degrades performances of automatic speech recognition system and also intelligibility of speech signal. To improve speech quality and performance of ASR system in the real world, original clean source speech signal should be recovered using only received convoluted speech signal. This problem is known as blind dereverberation if the convolutional channel is room impulse response. In this dessertation, a method for blind dereverberation based on ICA-based speech generative model was proposed to overcome the dependencies among speech samples. Also, several approaches have been proposed to solve the performance degradation problem of blind deconvolution and dereverberation under additive noises. In the real application, the conventional single-channel method doesn't show good performance. In this work, additive noise signal assumes as independent source component, and independent component analysis models of monaural and binaural processing for blind dereverberation were presented. Proposed methods in this dissertation are summarized as follows. First, an unified algorithm for blind deconvoluntion and dereverberation was derived using a proposed simple and extensible blind least square cost function in the frequency domain. Performance of the proposed unified algorithm was comparable with that of the conventional algorithm. Second, blind dereverberation using ICA-based speech generative model was proposed. For minimum phase reverberation channel, infomax blind deconvolution learning rule was modified to update inverse filter from independence transformed signal and for non-minimum phase reverberation channel, blind LS-based learning rule was derived. Proposed method was successfully applied to the simulated room impulse responses. Third, a monaural blind dereverberation model which assumes additive noise at the observation was proposed and learning rule was derived using the proposed blind least squares cost function. Results after using proposed monaural approach show slightly better performances compared with conventional single-channel method on both speaker dependent and speaker independent conditions, and also on the different reverberation channels with different additive noise levels. Forth, a binaural blind dereverberation model which assumes additive noises at the observation was proposed and learning rule was derived. Results of the proposed binaural processing approach show best performances compared with that of the conventional single-channel for both speaker dependent and speaker independent conditions, and also on the different simulated reverberation channels with artificially mixed additive noise levels. Even in the real recorded reverberated speech signals on the real room environment, the proposed method was successfully applied. Finally, several discussions were addressed from the results of proposed blind dereverberation methods.

현재까지는 음성 인식 기술이 많은 제약 때문에 실생활에서 널리 사용되고 있지 못하다. 음성 인식 성능 저하의 중요한 요인들 가운데 한 가지는 실세계에 존재하는 뒤섞인(convolutional) 채널의 영향 때문이다. 특히 방안에서 발생하는 반향(room reverberation)은 음성 인식기의 성능과 음질을 심각하게 저하시킨다. 반향으로 오염된 신호의 음질을 좋게 하고 음성 인식기 성능을 향상시키기 위해서는 관찰된 신호만을 이용해서 원래의 깨끗한 음성 신호를 복원할 수 있어야 한다. 이러한 문제를 해결하는 연구가 암묵 반향 제거 (blind dereverberation)이고, 반향 채널이 일반적으로 수천 탭(tap)의 시간 지연을 갖고 있고 원래의 신호가 시간적으로 의존도가 높은 음성 신호이기 때문에 어려운 문제이다. 본 논문에서는 음성 샘플들간의 독립성을 높여 주기 위해서, 먼저 독립 요소 분석(ICA)에 기반한 음성 생성 모델(generative model)을 이용한 암묵 반향 분리 방법을 제안하였다. 또한, 기존의 방법이 잡음하에서 암묵 반향 분리 성능이 저하되는 문제를 해결하기 위해서 몇가지 방법들이 고려되었다. 본 연구에서는 가산 잡음(additive noise) 신호를 독립 신호 성분으로 보고 인간의 한 쪽 귀(monaural)와 양 귀(binaural) 처리를 모사하는 독립 요소 분석 모델을 제안하였다. 본 논문에서 제안한 방법들은 다음과 같이 요약된다. 첫째, 주파수 영역에서 제안한 간단하고 확장성이 좋은 암묵 최소 제곱(least squares)함수를 사용하여 암묵 반향 제거를 위한 통합 알고리즘을 유도하였다. 제안된 통합 알고리즘은 기존의 방법과 동등한 성능을 보였다. 둘째, 독립 요소 분석에 기반한 음성 생성 모델을 사용하여 암묵 반향 제거 방법을 제안하였다. Infomax 알고리즘을 변형해서 최소 위상(minimum phase) 채널에 대해서, 그리고 암묵 최소 제곱 함수를 이용한 비최소 위상(non-minimum phase) 채널에 대한 학습 알고리즘들이 유도되었다. 제안된 방법은 실험적으로 얻어진 반향 채널에 대해서 좋은 결과를 보였다. 셋째, 가산 잡음이 반향 영향을 받은 음성 신호에 더해진 경우를 해결하기 위해서 마이크를 한 개 사용한 방법, 즉 한쪽 귀를 모방한 방법이 고려되었고 학습 방법이 유도되었다. 제안한 방법이 기존의 한 개 채널을 이용한 방법에 비해서 화자 종속인 경우와 독립인 경우, 그리고 몇 가지 경우의 가산 잡음의 에너지 크기들에 대해서도 모두 조금씩 좋은 성능을 보였다. 넷째, 인간의 양 귀 처리 모델을 모방하여 두 개의 마이크를 사용한 암묵 반향 제거 방법이 제안되었고 알고리즘이 유도되었다. 실험적으로 얻어진 반향 채널에 대한 실험 결과 기존의 한 개 채널을 이용한 방법이나 본 논문에서 제안한 한 쪽 귀 처리 모델과 비교했을 때 가장 좋은 성능을 보였다. 화자 종속인 경우와 독립인 경우, 다양한 반향 채널들에 대한 경우, 그리고 다양한 가산 잡음 크기들에 대한 결과 모두에게 일관되게 가장 좋은 성능을 확인 할 수 있었다. 더 나아가서 실제 방에서 실험 장비를 이용해서 측정한 음성 데이터들에 대해서도 제안한 방법이 성공적으로 적용됨을 확인할 수 있었다. 마지막으로, 제안된 암묵 반향 제거 방법의 결과들에 대해서 몇 가지 생각해 볼 내용들이 다루어졌다.

서지기타정보

서지기타정보
청구기호 {DEE 05029
형태사항 x, 106 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이종환
지도교수의 영문표기 : Soo-Young Lee
지도교수의 한글표기 : 이수영
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학전공,
서지주기 Reference : p. 99-106
주제 under noises
blind
monaural
잡음하
암묵
QR CODE qr code