서지주요정보
Melody extraction using melody pitch/non-melody pitch classification = 멜로디 피치/비멜로디 피치 분류를 이용한 멜로디 추출 알고리즘
서명 / 저자 Melody extraction using melody pitch/non-melody pitch classification = 멜로디 피치/비멜로디 피치 분류를 이용한 멜로디 추출 알고리즘 / Sang-Hun Park,.
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8023286

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 12042

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

This thesis considers a minimum mean-square error (MMSE) based melody extraction algorithm that reduces false-positive estimates of the melody pitch by classifying the estimated pitch candidates into melody pitch and non-melody pitch using support vector machine (SVM). The algorithm estimates the melody pitch in three steps. In the first step, the algorithm finds a harmonic structure within the melody search range that minimizes the mean-square error (MSE) between the harmonic structure model and the polyphonic audio. In the second step, the algorithm classifies the estimated pitch candidates into melody pitch and non-melody pitch based on harmonic amplitude contour and weighted MSE. Finally, in the last step, a single melody line is determined by a pitch identification algorithm and a smoothing process. The considered algorithm is tested on three databases: ADC04, MIREX05 and RWC. The results show that the considered algorithm is better than or comparable to other melody extraction algorithms.

본 학위논문에서는 최소자승평균오차(minimum mean-square error, MMSE) 기반의 멜로디 추출 알고리즘을 제안한다. 제안하는 멜로디 추출 알고리즘은 추정된 하모닉 구조 모델(harmonic structure model)에 대하여 서포트 벡터 머신(support vector machine, SVM)을 이용한 멜로디 피치/비멜로디 피치 분류를 수행하여 멜로디를 추정할 때 발생하는 양성 오류(false positive, FP)를 효과적으로 줄이는 데 주안점을 둔다. 제안하는 알고리즘은 크게 세 단계로 구성된다. 첫 번째 단계에서는 멜로디 추정 범위 내의 주파수에 대하여 하모닉 구조와 입력 다성 음악 간의 자승평균오차(mean-square error, MSE)를 최소화하는 하모닉 구조를 찾은 후, 찾은 각각의 하모닉 구조에 대한 자승평균오차를 이용하여 프레임 별로 $K$ 개의 피치 후보(pitch candidates)를 추출한다. 두 번째 단계에서는 추정된 피치 후보들의 하모닉 진폭(harmonic amplitude)과 자승평균오차 정보를 이용하여 서포트 벡터 머신 기반의 멜로디 피치/비멜로디 피치 분류를 수행하고 각 피치 후보가 실제 멜로디 피치일 확률을 구한다. 마지막 세 번째 단계에서는 각 피치 후보와 그 후보들의 멜로디 피치 확률을 이용하여 규칙 기반의 멜로디 결정 알고리즘을 적용하여 단일 멜로디를 얻고, 그 후 연속적으로 잘못 추정된 피치의 보정을 위하여 스무딩(smoothing) 알고리즘을 적용하여 최종 멜로디를 얻게 된다. 제안하는 알고리즘의 성능을 측정하기 위하여 ADC04, MIREX05, RWC의 세 가지 데이터베이스에 대해서 실험을 수행하였다. 실험 결과를 통하여 제안하는 알고리즘이 기존에 제안된 다른 알고리즘들보다 더 좋거나 비슷한 성능을 보임을 확인할 수 있었다.

서지기타정보

서지기타정보
청구기호 {MEE 12042
형태사항 v, 38 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박상훈
지도교수의 영문표기 : Chang-Dong. Yoo
지도교수의 한글표기 : 유창동
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학과,
서지주기 References : p. 30-34
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서