In this paper, a Hidden Markov Model (HMM)-based note onset detector for Query by humming (QBH) systems is proposed. Until now, most QBH systems have restricted the user to sing each note using predefined humming syllables instead of humming in a natural fashion. This restriction is applied to induce hard onsets which allows for more accurate onset detection at the cost of unnatural interaction. The considered note onset detector allows users to either sing using predefined humming syllables or hum using gliding nasal sounds. We defined three HMMs for our dictionary using log voicing degree and pitch variance as features: the silence model, the hard note model and the soft note model. The HMM-based onset detector decodes the input signal providing note onset information used for humming transcription. Experimental results show that the proposed algorithm outperforms conventional algorithms.
이 논문에서는 은닉 마르코프 모델을 기반으로 자연 흥얼거림의 음조 위치를 추출하고 있다. 지금까지의 대부분의 흥얼거림 검색 시스템들을 사용자로 하여금 `타` `다`와 같은 음절을 이용하도록 제한하였다. 이 제한 조건은 사용자로 하여금 음과 음 사이에 묵음 구간을 유도하여 보다 정확한 음의 시작점 을 찾기 위해서인데 이것은 데이터베이스와의 자연스러운 인터페이스를 구축하는 흥얼거림 검색 시스템의 본 목적에 어긋난다. 이 논문에서는 입력 신호가 콧노래든 특정 음절만을 이용한 노래들 음주 위치를 추출한다. 이것은 흥얼거림의 상태를 silence, hard note, soft note로 정의하고 은닉 마르코프 모델을 통하여 구현하였다. 이때 은닉 마르코프 모델을 구성하기 위해서 LVD와 pitch variance를 사용하였다. LVD는 음은 주기성을 표현하는 지표로 주기적인 신호인 음을 잘 표현한다. Pitch variance는 음의 전반부와 후반부의 변화를 잘 표현한다. 이 논문에서는 기존의 음절을 모델링한 은닉 마르코프 모델 기반의 음조 위치 추출 알고리즘 보다 좋은 결과를 보인다.