Speech recognition is the process of recognizing what is spoken and speaker recognition is the process of identifying who is speaking by the some information included in speech signal. Speech recognition technology is usually used many kinds of man-machine interfaces and speaker recognition technology can be used to verify speaker’s identity and control access to services such as voice dialing, banking by telephone, telephone shopping, database access services, security control for confidential information areas, and remote access to computers.
This thesis proposes realization of speech and speaker recognition system based on feedback for stabilizing various recognition values depend on spoken speech samples and speakers. Most of speaker recognition system is realized as text-dependent type to get high recognition efficiency, but speaker recognition system realized in this thesis have to be text-independent type because spoken speech sample is recognized simultaneously. Because text-independent type can change recognition value depend on spoken samples and speakers, recognition using system realized in this thesis is more difficult than the text-dependent system. So, in this thesis, compensation on the basis of feedback recognition value is used to solve the problem which is resulted from realized system.
음성인식은 무엇이 발성되었는가를 화자인식은 누가 발성하였는가를 음성신호에 담겨진 정보를 이용하여 인식해 내는 과정이다. 음성인식기술은 주로 인간-기계 인터페이스의 많은 분야에 사용되며, 화자인식은 화자신원확인과 전화다이얼링, 텔레뱅킹, 컴퓨터 원격접속등과 같은 써비스에 대한 접근을 제한하기 위해 사용될 수 있다.
본 논문에서는 발성샘플과 화자에 따라 변화하는 인식점수를 궤환시켜 안정화시키는 방법을 통해 음성 및 화자인식기를 구현하는것을 제안하고자 한다. 대부분의 화자인식기는 높은 인식성능을 얻기위해 문장종속형으로 구현되나 본 논문에서 구현된 인식기는 발성샘플에 대한 인식을 동시에 하여야 하므로 문장독립형으로 구현되었다. 문장독립형은 발성샘플과 화자에 따라 인식점수가 변하므로 본 논문에서 구현된 시스템은 문장종속형인식기에 비해 인식성능이 떨어진다. 그러므로 인식점수를 궤환을 통해 보상시킴으로써 위와 같은 성능저하에 대한 문제를 해결하고자 하였다.