서지주요정보
인식점수의 궤환을 통한 음성 및 화자인식 시스템의 구현에 관한 연구 = A study on realization of speech and speaker recognition system based on feedback of recognition value
서명 / 저자 인식점수의 궤환을 통한 음성 및 화자인식 시스템의 구현에 관한 연구 = A study on realization of speech and speaker recognition system based on feedback of recognition value / 김현구.
저자명 김현구 ; Kim, Hyun-Goo
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8015997

소장위치/청구기호

학술문화관(문화관) 보존서고

MME 05013

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Speech recognition is the process of recognizing what is spoken and speaker recognition is the process of identifying who is speaking by the some information included in speech signal. Speech recognition technology is usually used many kinds of man-machine interfaces and speaker recognition technology can be used to verify speaker’s identity and control access to services such as voice dialing, banking by telephone, telephone shopping, database access services, security control for confidential information areas, and remote access to computers. This thesis proposes realization of speech and speaker recognition system based on feedback for stabilizing various recognition values depend on spoken speech samples and speakers. Most of speaker recognition system is realized as text-dependent type to get high recognition efficiency, but speaker recognition system realized in this thesis have to be text-independent type because spoken speech sample is recognized simultaneously. Because text-independent type can change recognition value depend on spoken samples and speakers, recognition using system realized in this thesis is more difficult than the text-dependent system. So, in this thesis, compensation on the basis of feedback recognition value is used to solve the problem which is resulted from realized system.

음성인식은 무엇이 발성되었는가를 화자인식은 누가 발성하였는가를 음성신호에 담겨진 정보를 이용하여 인식해 내는 과정이다. 음성인식기술은 주로 인간-기계 인터페이스의 많은 분야에 사용되며, 화자인식은 화자신원확인과 전화다이얼링, 텔레뱅킹, 컴퓨터 원격접속등과 같은 써비스에 대한 접근을 제한하기 위해 사용될 수 있다. 본 논문에서는 발성샘플과 화자에 따라 변화하는 인식점수를 궤환시켜 안정화시키는 방법을 통해 음성 및 화자인식기를 구현하는것을 제안하고자 한다. 대부분의 화자인식기는 높은 인식성능을 얻기위해 문장종속형으로 구현되나 본 논문에서 구현된 인식기는 발성샘플에 대한 인식을 동시에 하여야 하므로 문장독립형으로 구현되었다. 문장독립형은 발성샘플과 화자에 따라 인식점수가 변하므로 본 논문에서 구현된 시스템은 문장종속형인식기에 비해 인식성능이 떨어진다. 그러므로 인식점수를 궤환을 통해 보상시킴으로써 위와 같은 성능저하에 대한 문제를 해결하고자 하였다.

서지기타정보

서지기타정보
청구기호 {MME 05013
형태사항 vii, 72 p. : 삽도 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Hyun-Goo Kim
지도교수의 한글표기 : 양민양
지도교수의 영문표기 : Min-Yang Yang
학위논문 학위논문(석사) - 한국과학기술원 : 기계공학전공,
서지주기 참고문헌 : p. 71-72
주제 음성인식
화자인식
인식점수
궤환한요소해석
공정 및 온도 분포
100W급 스택의 유동해석
Speech recognition
speaker recognition
recognition value
feedbackg map
current density and temperature distribution
the flow analysis of 100W-stack
QR CODE qr code