Automatic speech recognition (ASR) system has been developed over several decades. Although many researchers have found numerous methodologies for improving its performance, the speech processing in noisy environments remains as a difficult problem in this field. One of the solutions is using neck-microphones which are not affected by the environmental noises. However, neck-microphones distort the original voice signals since they only capture the vibrations of vocal tracts. In this context, we consider a method of enhancing features of neck-microphone signals using zero-crossings. Furthermore, we also consider using the concept of gray level co-occurrence matrix (GLCM) which has been usually used for image processing like texture analysis. In this paper, the GLCM is applied to find the suitable zero-crossing features for speech recognition. Through the simulation for speech recognition using the neck-microphone voice command system, we have shown the suggested method provides the better performance than other approaches using conventional speech features.
음성인식 시스템(ASR)은 과거 수십년간 많은 발전을 거듭해 현재는 괄목할 만한 성과를 내기 이르렀다. 그러나 많은 연구에도 불구하고 현재 노이즈환경 및 반향환경에서의 음성인식은 여전히 큰 문제로 남아있다. 본 연구에서는 성대마이크를 이용한 음성명령시스템에 있어서의 특징 강화 방법론을 제시하였다. 영점교차 알고리즘에 의한 음성인식은 노이즈 환경에서 기존의 음성특징추출 방법들에 비해 더욱 강인하다는 것이 알려져왔으며 성대마이크의 특성상 음성의 왜곡현상에도 강인한 효과가 있는 것을 본 연구에서 확인할 수 있었다. 또한 기존의 영점교차 알고리즘에 의한 특징벡터를 이미지 프로세싱의 방법론의 적용을 통해 강화해 보았으며, 그 실험 결과가 기존 영점교차 알고리즘에 비해 향상되었음을 확인할 수 있었다. 본 논문에서는 우선 GLCM 의 측도들을 음성신호에 적용할 수 있는 방법을 소개하고, 기존의 마이크와 비교해 성대마이크가 가지는 특징을 분석하였다. 마지막으로 실험을 통해 상기된 이론들을 검증하여 보았다.