서지주요정보
Finite state vector quantization 과 hidden markov modeling 을 이용한 격리 단어 인식에 관한 연구 = A study on isolated word recognition based on finite state vector quantization and hidden markov model
서명 / 저자 Finite state vector quantization 과 hidden markov modeling 을 이용한 격리 단어 인식에 관한 연구 = A study on isolated word recognition based on finite state vector quantization and hidden markov model / 구준모.
발행사항 [서울 : 한국과학기술원, 1987].
Online Access 원문보기 원문인쇄

소장정보

등록번호

4104428

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 8706

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis, an isolated word recognition system based on the finite state vector quantization (FSVQ) and a hidden Markov model (HMM) have been studied. The FSVQ is used as a front end processor of the recognition system to reduce the computational complexity of the conventional isolated word recognition system that utilizes the HMM. In addition, the labeled transition FSVQ design method using the HMM parameters is used to reduce the computational complexity of the training procedure. The vocabularies to be recognized are ten Korean digits (0-9) uttered in an ordinary ambience by male speakers. We have used absolute sum and zero crossing rate for end point detection, and a set of 10 linear prediction coefficients (LPC) as a feature vector. In our simulation the error rate and computational complexity have been examined for different numbers of HMM states or different VQ codebook sizes. The results have been compared with that of the conventional isolated word recognition system based on the HMM. Results of the proposed isolated word recognition system are as follows. In the case of speaker-dependent recognition, as the number of codeword M increased, the error rate decreased. Also, the computational complexity decreased as the number of states N and the number of codeword M increased. Under the condition of M=64, N=3, the recognition accuracy was 97.8%, and the average number of searches were 37.8, which is only 59% of the computational complexity of a conventional recognition system. In the case of speaker-independent recognition, the trends were the same as that of the speaker-dependent case. Under the condition of M=128, N=5, the recognition accuracy was 95%, and the average number of searches were 97.3, that is 76% of the computational complexity of a conventional recognition system. Comparing these results with the performance of the conventional isolated word recognition system based on the HMM, computational complexity of the proposed system is far less, yet its recognition accuracy and storage size are about the same.

본 논문은 finite state vector quantization(FSVQ)와 hidden Markov model( HMM )을 이용하는 격리단어 인식에 관한 연구이다. HMM을 이용하는 기존의 격리단어 인식시스템의 계산량을 줄이기 위하여 front end processor로 FSVQ를 도입하였다. 한편, FSVQ를 도입하므로써 인식시스템의 training 과정이 복잡하여 지는것을 방지하기 위하여 HMM parameter를 이용하여 labeled transition FSVQ를 설계하는 방법을 제안하였다. 이렇게 설계된 FSVQ와 HMM을 이용하여 격리단어를 인식하는 알고리즘을 제안하고 이에 관하여 simulation을 수행하였다. 인식대상 어휘는 남성이 발음한 열개의 한국에 숫자( 영 - 구 )로서 보통의 환경에서 녹음되었다. 절대값과 영교차율을 이용하여 끝점을 검출하였고 10차 LPC 계수로 음성의 특징을 추출하였다. Simulation은 HMM의 state수와 VQ codebook의 크기를 변화시켜 가면서 인식율과 계산량을 조사하고 이를 HMM을 이용하는 기존의 격리단어 인식시스템과 비교하였다. 그 결과를 살펴보면 화자종속의 경우, codeword의 수 M이 증가할수록 인식율이 증가하고 state 수 N과 codeword 수 M이 증가할수록 계산량이 감소함을 알 수 있었다. M = 64, N = 5 인 경우에 인식율은 97.8%이며 이때의 평균 search수는 37.8개로 HMM을 이용하는 기존의 음성인식 시스템이 갖는 계산량의 59%에 해당된다. 화자독립의 경우, 화자종속과 동일한 경향을 보여 주었으며 M = 128, N = 5인 경우에 인식율은 95%이며 평균 search 수는 97.3 개로 HMM을 이용하는 기존의 음성인식 시스템이 갖는 계산량의 76% 에 해당된다. 이를 HMM을 이용하는 기존의 음성인식 시스템의 성능과 비교하여 보면 계산량은 감소하지만 인식율이나 memory의 사용량은 거의 동일하다.

서지기타정보

서지기타정보
청구기호 {MEE 8706
형태사항 vi, 99 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Jun-Mo Koo
지도교수의 한글표기 : 은종관
지도교수의 영문표기 : Chong-Kwan Un
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 93-97
주제 Vector processing (Computer science)
Speech perception.
Word recognition.
Machine learning.
Markov 과정. --과학기술용어시소러스
벡터 양자화. --과학기술용어시소러스
음성 인식. --과학기술용어시소러스
식별 학습. --과학기술용어시소러스
Markov processes.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서