Finite state vector quantization 을 이용한 격리단어 인식에 관한 연구 = A study on isolated word recognition based on finite state vector quantization
서명 / 저자 Finite state vector quantization 을 이용한 격리단어 인식에 관한 연구 = A study on isolated word recognition based on finite state vector quantization / 윤원식.
발행사항 [서울 : 한국과학기술원, 1986].
Online Access 제한공개(로그인 후 원문보기 가능)원문





학술문화관(문화관) 보존서고

MEE 8634

휴대폰 전송







In this thesis work, an isolated word recognition system has been studied. Automatic endpoints detection is done based upon energy and level crossing rate, and feature extraction is performed by the linear predictive coding method. The finite state vector quantization (FSVQ) method is used as a pattern similarity measure between the test pattern and the reference pattern. The FSVQ method requires far less computations than the ordinary memoryless VQ method, yet yields almost the same accuracy. There are four design algorithms in the FSVQ according to the structure of the finite state vector quantizer and the method of finding a next state function. Among these algorithms, the labeled state FSVQ schemes by a conditional histogram method and by an omniscient design method have been used to recognize isolated words. These algorithms have been tested using the ten Korean digits (0-9). The data base used for reference pattern generation and recognition test consists of a speech group recorded in a real environment. It is shown that the accuracy obtained by the conditional method is better than that obtained by the omniscient method in both speaker-dependent and speaker-independent recognition systems. In addition, the performance of the proposed FSVQ method has been compared to that of a conventional VQ method. In a speaker-dependent recognition system, the accuracy of the conditional histogram FSVQ method was 98.6%, while that of the single-section VQ method was 99.0%. The conditional histogram FSVQ method reduces classification time up to about one fifth as compared to the system using the single-section VQ method. Also, the two methods in a speaker-independent recognition system have been compared. When the numbers of codeword were 16 and 32, the accuracies of the conditional histogram method were 93.6% and 93.4%, respectively. In the case of having 16 and 32 codewords, average numbers of search were 5.2 and 3.7, respectively. The accuracies of the single-section VQ method were 92.2% and 96.2% for 16 and 32 codewords, respectively. In a speaker-independent recognition system, the FSVQ method greatly reduces classification time as compared to the system using the single-section VQ method.

본 논문에서는 격리단어 인식에 관하여 연구하였다. 에너지와 level crossing rate 를 이용하여 끝점검출을 하였으며 linear predictive coding에 의하여 음성특징 추출을 하였다. Test패턴과 기준패턴의 유사도를 측정하기 위한 수단으로는 vector quantization 방법보다 계산량이 훨씬 적은 finite state vector quantization(FSVQ)을 이용하는 방법이 새로이 제안되었다. FSVQ는 next state function을 구하는 방법과 그 구조에 의해 4가지의 구성방법이 있다. 이 구성방법중에서 conditional histogram 방법과 omniscient design 방법에 의한 labeled state FSVQ에 근거를 두어 격리단어 인식을 하였다. 이때 음성인식 test를 위한 어휘로는 영부터 구까지의 숫자음성을 사용하였으며, 이 음성은 방음장치가 되어있지 않은 보통 환경에서 녹음한 것이다. 화자종속 음성인식시스템과 화자독립 음성인식시스템의 인식율 모두에서 omniscient design 방법에 비해 conditional histogram 방법의 성능이 더 좋게 나타났다. 또한 기존의 VQ방법과 본 연구에서 새로이 제시한 FSVQ 방법에 의한 인식율을 비교해 보았다. 화자종속 인식시스템의 경우 conditional histogram 방법에 의한 인식율은 98.6% 이었으며, single-section VQ 방법에 의한 인식율은 99.0 %를 나타내었다. 이 때 conditional histogram 방법은 single-section VQ방법에 비해 3/16으로 계산량이 감소하였다. 또한, 화자독립 인식시스템의 경우 conditional histogram 방법에 의한 인식율은 codeword 수가 16 이고 평균 search 수가 5.2일때 93.6%로 나타났고, codeword 수가 32이고 평균 search 수가 3.7 일때 93.4 %를 나타내었다. Single-section VQ 방법에 의한 인식율은 codeword수가 각각 16,32 일때 각각 92.2%, 96.2 %로 나타났다. FSVQ를 이용한 화자독립 인식시스템에서도 single-section VQ방법에 비해 계산량을 많이 줄일 수 있다.


청구기호 {MEE 8634
형태사항 vi, 107 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Won-Sig Youn
지도교수의 한글표기 : 은종관
지도교수의 영문표기 : Chong-Kwan Un
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 101-105
주제 Speech perception.
Word recognition.
Prediction theory.
Coding theory.
벡터 양자화. --과학기술용어시소러스
음성 인식. --과학기술용어시소러스
예측 부호화. --과학기술용어시소러스
화자 인식. --과학기술용어시소러스
Vector processing (Computer science)





이 주제의 인기대출도서