서지주요정보
Audio fingerprint extraction method using multi-level quantization scheme = 다중 레벨 양자화 기법을 적용한 오디오 핑거프린트 추출방법
서명 / 저자 Audio fingerprint extraction method using multi-level quantization scheme = 다중 레벨 양자화 기법을 적용한 오디오 핑거프린트 추출방법 / Won-Sik Song.
저자명 Song, Won-Sik ; 송원식
발행사항 [대전 : 한국정보통신대학교, 2006].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000711

소장위치/청구기호

문지도서관2층 학위논문

ICU/MS06-37 2006

SMS전송 소장위치

도서상태

이용가능

대출가능

반납예정일

초록정보

In this thesis, we propose a new audio fingerprint extraction method, based on Philips music retrieval algorithm, which uses energy difference of neighboring frequency bands and their probabilistic characteristics. Since Philips method uses too many filter-banks in limited frequency band, it may cause audio fingerprints to be highly sensitive to additive noises and to have too high correlation between neighboring bands. The proposed method improves robustness to noises by reducing the number of filter-bank bands while it maintains the discriminative power by representing the energy difference of bands with 2 bits where the quantization levels are determined by probabilistic characteristics. The correlation among 4 different levels in 2 bits is utilized not only in effective similarity measurement, but also in efficient reduction of searching area. The proposed method is evaluated in various noises such as channel noise, environmental noises (street, department, car, office, restaurant) and combined noises. The experiment results show that the proposed method not only gives better performance for environmental noises and highly degraded combined noises, but also takes less time in identifying the music than the Philips method.

본 석사 논문은 필립스의 음악 검색 기법을 기반으로 필터 뱅크 에너지 변화량과 음악의 통계적인 특성을 이용한 오디오 핑거프린트 추출 방법을 제안하였다. 기존의 필립스 방식은 제한된 주파수 영역을 너무 많은 필터 뱅크로 분할하여 분석함으로써 밴드들 사이에 연계성 및 왜곡에 대한 민감도가 증가하는 특징을 보일 수 있다. 제안된 방법은 필터 뱅크의 밴드 수를 줄여 왜곡에 대한 강인성을 증진시키고, 필터뱅크 에너지의 변화량의 부호와 크기 정보를 통계적 특성을 고려한 양자화 기법을 이용해 2비트로 할당함으로써 오디오 핑거프린트의 고유성을 확보하였다. 추출된 2 비트는 4개의 level로 정보를 표현함으로 각 level 사이에 연계성이 존재하게 된다. 이 같은 level 사이의 연계성은 유사도 측정 시 이용될 뿐만 아니라 오디오 핑거프린트를 기준으로 검색 영역을 확장하는 방식에서는 효율적인 검색 영역을 선택할 수 있는 정보로 활용되었다. 제안된 방식은 채널왜곡, 주변 잡음(거리,백화점, 자동차, 사무실, 식 당), 복합잡음(채널+주변 잡음) 등의 실험 환경을 통하여 평가되었다. 제안된 방식이 주변 잡음이 심한 환경에서 뛰어난 성능을 보였다. 또한 제안된 방식의 오디오 핑거프린트의 확산성의 증가로 검색 속도 또한 향상되는 특징을 보였다.

서지기타정보

서지기타정보
청구기호 {ICU/MS06-37 2006
형태사항 vii, 38 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 송원식
지도교수의 영문표기 : Hoi-Rin Kim
지도교수의 한글표기 : 김회린
학위논문 학위논문(석사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 35
주제 audio fingerprint
probabilistic characteristics
quantization
energy difference of neighboring filter-banks
오디오 핑거프린트
통계적 특성
양자화
필터뱅크의 에너지 변화량
QR CODE qr code