서지주요정보
TDNN과 HMM을 결합한 새로운 단어 인식 방식에 관한 연구 = A new approach to word recognition by combining TDNN and HMM
서명 / 저자 TDNN과 HMM을 결합한 새로운 단어 인식 방식에 관한 연구 = A new approach to word recognition by combining TDNN and HMM / 방영조.
발행사항 [대전 : 한국과학기술원, 1991].
Online Access 제한공개(로그인 후 원문보기 가능)원문

소장정보

등록번호

8002090

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 9122

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis work, a new word recognition algorithm using the time delay neural network(TDNN) and the hidden Markov modeling(HMM) is proposed and the performance of the algorithm is obtained and compared with those of VQ/HMM and TDNN-based recognition algorithms. The proposed word recognition algorithm is based on the TDNN architecture and HMM. The output activation values of TDNN are obtained by introducing the membership functions of the fuzzy set theory to TDNN and used as input vectors for HMM. The HMM training is done on the output activation values of TDNN for each word. Since this proposed word recognition algorithm has both the good short-time classification properties of TDNN and the good time-warping properties of HMM, we can obtain the improved recognition accuracy for isolated word recognition as well as connected word recognition. For the computer simulation of the proposed TDNN/HMM word recognition algorithm, input speech signal is sampled at 10kHz and preemphasised. LPC coefficients are obtained from each frame of speech signal samples using the 14th order LPC autocorrelation analysis. The LPC coefficients are then transformed into cepstral coefficients. Finally, the feature vectors for the speech recognition system, mel-scaled cepstral coefficients, are obtained by warping the frequency scale using the bilinear transform. From the computer simulation results for speaker-dependent Korean digit recognition, we obtain the recognition accuracy of 96.36% using the proposed TDNN/HMM algorithm. The performance improvements of the proposed algorithm over the VQ/HMM and the TDNN methods are about 3.4% and 2.5%, respectively. As for the connected digit recognition, the proposed TDNN/HMM algorithm results in the recognition rate of 95.8% which is about 1.3% higher than that of the VQ/HMM method.

본 논문에서는 신경회로망을 이용하여 격리단어 및 연결단어를 인식하기 위한 새로운 인식 알고리즘을 제안하였고 제안된 인식 알고리즘의 성능을 분석하기 위하여 다른 인식 알고리즘들(VQ/HMM, TDNN)의 성능과 비교하였다. 먼저 입력 음성신호를 10kHz로 샘플링하여 14차의 LPC autocorrelation 방법으로 LPC 계수를 얻었다. 이렇게 추출된 LPC 계수는 다시 cepstral 계수로 변환되었다. 마지막으로 인식 시스템에서 사용되는 특징벡터를 얻기위해 bilinear transform을 하여 cepstral 계수를 mel-scaled cepstral 계수로 변환하였다. 본 논문에서 제안한 인식 알고리즘은 TDNN과 HMM에 기초를 두고 있다. TDNN 인식 알고리즘은 각 단어에 대한 second hidden layer에서의 각 unit들의 합으로써 단어를 인식하는 알고리즘이다. 이렇게 unit의 합으로 인식을 하게되면 학습이 잘되지 않은 단어에 대해서 오류가 발생하기 쉽다. 그러므로 본 논문에서는 TDNN에서 각 단어에 대한 output activation 값을 fuzzy set 이론의 membership function으로 취급하여 이로부터 그 단어의 FHMM 모델을 얻도록 하는 TDNN/ HMM 인식 알고리즘을 제안한다. 또한 TDNN/ HMM 인식 알고리즘은 TDNN 인식 알고리즘으로는 인식하기 힘든 연결단어 인식에도 적용할 수 있는 장점이 있다. 컴퓨터 모이 실험 결과 본 논문에서 제안한 TDNN/ HMM 인식 알고리즘이 다른 인식 알고리즘보다 더 좋은 인식률을 보임을 밝힐 수 있었다.

서지기타정보

서지기타정보
청구기호 {MEE 9122
형태사항 iv, 67 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Young-Jo Bang
지도교수의 한글표기 : 이황수
지도교수의 영문표기 : Hwang-Soo Lee
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 63-66
주제 Word recognition.
Markov processes.
Delay lines.
Neural networks (Computer science)
음성 인식. --과학기술용어시소러스
Markov 과정. --과학기술용어시소러스
시간 지연 시스템. --과학기술용어시소러스
신경 회로망. --과학기술용어시소러스
벡터 양자화. --과학기술용어시소러스
Speech perception.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서