단어 결합 모델링을 이용한 한국어 연속 음성 인식에 관한 연구 = A study on continous speech recognition of Korean language using word juncture modeling
서명 / 저자 단어 결합 모델링을 이용한 한국어 연속 음성 인식에 관한 연구 = A study on continous speech recognition of Korean language using word juncture modeling / 최인정.
발행사항 [대전 : 한국과학기술원, 1994].
Online Access 제한공개(로그인 후 원문보기 가능)원문





학술문화관(문화관) 보존서고

MEE 94070

휴대폰 전송







In this thesis work, we study continuous speech recognition of Korean language using acoustic models of word juncture coarticulation. To alleviate the performance degradation due to coarticulation problems, we use context-dependent units that model inter-word transitions in addition to intra-word transitions. In all cases the initial phone of each word has to be specified for each possible final phone of the previous word and similarly for the final phone of each word. We also use position-dependent units to improve the discriminative power between units. Position-dependent units are obtained by modeling intra-word and inter-word units independently. We propose an improved method to model word junctures by modifying the model merging method. Using some single-context units from an intra-word set, we can increase the consistency of models in the word boundaries without more training. Simulation results show that when the improved models of word juncture coarticulation are used, the recognition performance is considerably improved compared to the baseline system using only intra-word units.

본 논문에서는 연속 음성 인식에서 중요한 문제인, 단어 경계 영역에서의 조음화현상을 효과적으로 모델링하기 위한 방법에 관하여 연구하였다. 단어 내부에서뿐만 아니라 단어 경계 영역에서의 조음화 현상을 모델링하기 위하여 좌,우의 음소를 고려하는 CD PLU를 기본 인식 단위로 사용한다. 그러나 이 인식 단위는 한정된 학습 데이타에 비해 모델수의 과다로 학습성의 문제를 초래한다. 이러한 학습성 결핍 문제를 해결하기 위하여 정보이론에 근거한 context 통합 방법을 적용하여 얻어진 일반화된 triphone을 인식 단위로 사용하였다. 단어 경계 영역에서 일어나는 조음화 현상은 inter-word CD PLU를 사용하여 모델링하였다. 또한 inter-word 단위와 intra-word 단위를 독립적으로 모델링하여 구성한 position -dependent PLU를 사용하였다. 이 방법은 subword 모델이 단어의 어느 부분에 위치하느냐에 따라 특성이 달라질 수 있다는 착안에서 나왔으며, 대용량의 인식 시스템에 적합한 모델링 방법이다. 다음으로 단어 경계 영역에 대한 모델링의 상세성을 개선하였다. 이 방법은 baseline 시스템에서 얻어진 single-context PLU를 이용하여 단어 경계 부분을 더 상세히 모델링하는 방법으로서, 추가적인 학습이 없이 인식 성 능을 개선할 수 있다. 마지막으로 한정된 학습 데이타, 상세한 인식 단위의 사용 등 으로 인한 모델 파라미터의 통계적 신뢰성의 결여 문제를 보완하기 위하여 공분산 smoothing 방법과 각 PLU마다 발생 빈도수에 따라 다른 수의 mixture 성분을 사용하였다. 이 방법을 사용하여 모델 파라미터가 부족 추정되는 문제를 해결함으로서 인식 성능을 상당히 개선할 수 있었다. 제안된 방법들의 평가를 위하여 102 단어로 구성된 시간구 문장에 대해 인식 실험을 하였다. 컴퓨터 모의 실험을 통하여 이 논문에서 제안한 모델링 방법과 학습성개선 방법을 사용하여, intra-word PLU만을 인식 단위로 사용하는 baseline 시스템에 비해 인식 성능이 상당히 개선됨을 확인할 수 있었다.


청구기호 {MEE 94070
형태사항 iv, 57 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : In-Jeong Choi
지도교수의 한글표기 : 은종관
지도교수의 영문표기 : Chong-Kwan Un
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 54-57
주제 Korean language.
Acoustic models.
Juncture (Linguistics)
음성 인식. --과학기술용어시소러스
음성 해석. --과학기술용어시소러스
음소. --과학기술용어시소러스
Speech perception.





이 주제의 인기대출도서