Fingerprint is a vector which uniquely describes the information of audio content. The purpose of the audio fingerprinting system is to recognize the original or perceptually equivalent contents. The performance of the audio fingerprinting system is measured how fast and correct a content is recognized. Therefore, the database search section in the system is a crucial factor to determine the performance of the entire system. By the complexity and the vast amount of information of the audio data, the audio data need to be represented by high-dimensional fingerprints. The search of high-dimensional data has been in difficulties for the exponential increase of the query time according to the dimension. This problem is called 'the curse of dimensionality'. As one of the solutions to remove the limitation of dimensionality, region-conserving hashing scheme is newly proposed by Indyk et al. By appling region-conserving hashing scheme in the previously implemented audio fingerprinting system, the fingerprint space can be divided evenly and the hashed values of fingerprint can be distributed sparsely. Region-conserving hashing function makes close fingerprints into same hashed value. Expermental results show the improvement of the audio fingerprinting system for the performance of database search.
핑거프린트는 오디오 컨텐츠의 정보를 유일하게 표현한 벡터이다. 오디오 핑거프린팅 시스템의 목적은 인지적으로 동일한 컨텐츠를 인식하는 것에 있다. 오디오 핑거프린팅 시스템의 성능은 컨텐츠를 얼마나 빠르고 정확하게 인식하느냐에 달려 있다. 따라서 오디오 핑거프린팅 시스템의 데이터베이스 검색은 시스템의 성능을 결정하는 중요한 과정이다. 오디오 데이터는 복잡하고, 표현해야할 정보의 양이 방대하기 때문에 오디오 데이터는 고차원의 필거프린트로 표현되어야 한다. 고차원 데이터의 검색은 차원의 증가에 따라 기하급수적으로 증가하는 검색시간으로 인하여 어려움이 있어 왔다. 이는 '차원성의 저주'라고 불리운다. 차원성의 저주를 없애기 위한 해결법 중 하나로, 지역성 보존 해싱방법이 Indyk 등에 의해 새롭게 제안되었다. 구현된 오디오 핑거프린팅 시스템에 지역성 보존 해싱기법을 적용함으로써 핑거프린트 공간을 균등하게 나눌 수 있었고, 해싱에 의해 동일한 값을 갖는 핑거프린트 묶음들 간의 거리를 넓힐 수 있었다. 지역성 보존 해싱함수는 위치상 가까운 핑거프린트들을 동일한 해싱값에 대응시키는 특성이 있다. 실험 결과를 통해 데이터베이스 검색을 통한 지역성 보존 해싱기반 오디오 핑거프린팅 시스템의 성능 개선을 확인할 수 있다.