서지주요정보
An improvement of decision tree-based unseen model prediction = 결정트리를 이용한 비관측모델 추정밥법 개선
서명 / 저자 An improvement of decision tree-based unseen model prediction = 결정트리를 이용한 비관측모델 추정밥법 개선 / Sung-Tak Kim.
발행사항 [대전 : 한국정보통신대학교, 2003].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000362

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS03-57 2003

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In large vocabulary or vocabulary independent speech recognition, if using triphone models as acoustic models, we often encounter unseen triphone models that are not covered in the training data. These unseen triphone models can be predicted by using decision trees. Decision tree-based state tying has been proposed in the recent years as the most popular approach for clustering the states of context-dependent hidden Markov models. The aims of decision tree-based state tying are to reduce the number of free parameters and to predict the probability distributions of the unseen models. For more accurate tree-based unseen model prediction, the important issues are how to define the question sets and the stop criteria, and how to select the question that optimally splits the current node into child nodes. To predict the unseen models for vocabulary-independent speech recognition, we proposed three methods in constructing decision trees and observed on the effects of CMN on the unseen model prediction by using these methods. Two of these methods are related to stop criteria and question selection. The other is combined with the two methods aforementioned. The first method automatically decides the threshold values for stop criteria, and the second uses an additional condition in the question selection in order to overcome the drawback of the conventional question selection. The last uses probability distributions of fairly trained states in order to reliably predict the unseen models. In this thesis, we perform an experiment on four different cases to test several environments of vocabulary-independent speech recognition. The first case is that the test vocabulary is totally different from the training vocabulary. In the second case, the test vocabulary is different from the training vocabulary with 75%. The third case is that the test vocabulary is different from the training vocabulary with 50%, and finally, the forth case is that the test vocabulary is different from the training vocabulary with 25%. The average word error rate without the CMN was reduced to 13.1%, 16.6%, and 21.9%, respectively. And, the average word error rate with the CMN was reduced to 20.4%, 24.6%, and 26.6%, respectively. From these results, we can conclude that the proposed methods are effective on the unseen model prediction for vocabulary-independent speech recognition.

HMM(Hidden Markov Model) 기반 음성인식에서 모델 파라미터 공유에 대한 연구가 계속되어 왔다. 모델 파라미터 공유를 통해 음향모델의 정밀도는 유지하면서, 모델의 파라미터 수는 줄여서 강인한 훈련이 가능하게 된다. 이때 가변어휘 음성인식의 경우 훈련환경에서 관측되지 않은 모델들의 적절한 확률값 추정이 매우 중요한 문제가 된다. 이러한 문제를 해결하기 위한 방법으로 파라미터 공유와 비관측모델 추정이 가능한 binary decision tree를 많이 이용한다. 본 논문은 가변어휘 음성인식을 위한 비관측모델 추정시 모델의 신뢰도를 향상시키기 위한 개선된 결정트리 구현 방법에 대하여 연구하였다. 보다 정밀한 비관측모델 추정을 위해 고려해야 할 점이 많이 있지만, 특히 decision tree의 크기, question sets, 그리고 question 선택 방법이 중요한 요소이다. 본 연구에서는 question sets을 제외한 decision tree의 크기, question을 선택하는 방법, 그리고 위의 두 가지 방법을 적절히 결합한 보다 정확한 비관측모델 추정방법을 제안하였다. 적절한 decision tree의 크기를 결정하는 방법으로 state pool에 있는 상태확률값과 관측모델들의 수를 이용하였고, question 선택 방법으로는 decision tree에서 YES node가 NO node보다 중요하다는 점을 이용하였으며, 마지막으로, 불균등하게 훈련되어진 관측모델 대신에 균등하게 훈련되어진 모델을 사용하여 decision tree를 재구성하는 방법을 적용하였다. 가변어휘 음성인식 실험을 위하여 인식어휘를 관측어휘와 비관측어휘의 비에 따라 4가지 다른 환경에 대하여 실험을 수행하였고, CMN의 사용 유무에 따른 결과도 관측하였다. 제안된 방법을 이용하여, CMN을 사용하지 않은 경우엔 평균 word error rate가 각각의 제안된 방법들이 13.1%, 16.6%, 그리고 21.9%로 감소함을 보였고, CMN을 사용한 경우엔 20.4%, 24.6%, 그리고 26.6%로 감소함을 보였다. 위의 결과로 우리는 제안한 방법이 가변어휘 음성인식을 위한 비관측모델 추정에 효과적임을 알 수 있었다.

서지기타정보

서지기타정보
청구기호 {ICU/MS03-57 2003
형태사항 ix, 50 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김성탁
지도교수의 영문표기 : Hoi-Rin Kim
지도교수의 한글표기 : 김회린
학위논문 학위논문(석사) - 한국정보통신대학원대학교 : 공학부,
서지주기 References : p. 45-47
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서