서지주요정보
Noise-robust speech detection using spectral variation information = 주파수 변동정보를 이용한 노이즈에 강인한 음성검출
서명 / 저자 Noise-robust speech detection using spectral variation information = 주파수 변동정보를 이용한 노이즈에 강인한 음성검출 / Young-Min Kim.
발행사항 [대전 : 한국정보통신대학교 2004].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000403

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS04-15 2004

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

This paper deals with a new parameter for voice detection which is used in various speech engineering areas such as speech synthesis, speech recognition and speech coding. Coefficient of variation (CV) of speech spectrum as well as other feature parameters is used for the detection of speech. CV is calculated only in the specific range of speech spectrum and gives information of existence of pitch in speech. Average magnitude and spectral magnitude are also employed to improve the performance of detector. Those parameters helps to detect unvoiced sound on start point. We evaluate the performance of detector by frame difference between proposed algorithm and hand labeled one. Proposed algorithm is compared with energy -based speech detection algorithm which using LCR instead of ZCR. Energy-based algorithm with noise reduction by Kalman filter is also compared with proposed algorithm. From the flag value which is results of three feature parameters, we are able to detect speech boundaries more accurately in low SNR noisy environment. Proposed algorithm outperform conventional energy-based algorithm in most kinds of noise and coefficient of variation parameter can be used to voice activity detection or real-time end point detection algorithm.

음성인식, 음성코딩, 음성합성 등 음성과 관련된 음성신호처리의 모든 분야에서 음성신호의 음성구간을 검출하는 일은 매우 중요하다. 음성신호에서 음성구간의 시작점과 끝점은 발성시 여러 가지 요인에 의해 검출에 어려움이 있고 노이즈가 부가되었을 경우 더욱 어려워진다. 본 논문에서는 낮은 신호대잡음비 환경에서 음성검출을 보다 정확하게 검출하는 알고리즘을 소개하고자 한다. 이 알고리즘의 특징은 주파수 영역에서의 스펙트럼의 크기로부터 미리 정한 특정 구간내에서 변동계수를 이용하는 것이다. 변동계수는 특성상 전체적인 크기에 영향을 적게 받고 피치의 유무를 잘 나타내주는 파라미터이다. 변동계수에 기존에 사용되던 시간영역에서의 평균크기와 주파수영역에서의 평균크기를 부가 이용함으로써 정확성을 향상시켰다. 세가지 특징벡터를 이용하여 나온 flag 값으로부터 음성구간을 검출하였으며 임계값은 묵음구간으로 가정한 80msec으로부터 계산된 통계값을 이용하였다. 여러 가지 노이즈에 대해 실험한 결과 제안된 알고리즘은 기존의 에너지에 기반한 음성검출보다 월등한 성능을 보여주었으며 칼만 필터를 이용하여 노이즈를 감소시킨 후 에너지에 기반한 음성검출보다도 나은 성능을 보여주었다. 앞으로 변동계수는 문장에서의 실시간 음성검출시나 다른 분야에서도 이용될 수 있을 것이다.

서지기타정보

서지기타정보
청구기호 {ICU/MS04-15 2004
형태사항 viii, 37 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김영민
지도교수의 영문표기 : Min-Soo Hahn
지도교수의 한글표기 : 한민수
학위논문 학위논문(석사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 34-35
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서