Thanks to compact data representations and fast similarity computation, many binary code embedding techniques have been recently proposed for large-scale similarity search used in many computer vision applications including image retrieval. Most of prior techniques have centered around optimizing a set of projections for accurate embedding. In spite of active research efforts, existing solutions suffer both from diminishing marginal efficiency as more code bits are used, and high quantization errors naturally coming from the binarization.
In order to reduce both quantization error and diminishing efficiency we propose a novel binary code embedding scheme, Quadra-Embedding, that assigns two bits for each projection to define four quantization regions, and a novel binary code distance function tailored specifically to our encoding scheme. Our method is directly applicable to a wide variety of binary code embedding methods. Our scheme combined with four state-of-the-art embedding methods has been evaluated with three public image benchmarks. We have observed that our scheme achieves meaningful accuracy improvement in most experimental configurations under k- and e-NN search.
최근 대용량 근접점 검색을 적은 메모리 용량과 빠른 유사도 계산으로 처리하는 이진 코드 임베딩 방법들이 소개되어 이미지 검색을 비롯한 다양한 컴퓨터비전 분야에 적용되고 있다. 기존의 방법들은 이미지를 보다 유사도를 정확하게 보존하는 이진 코드로 임베딩하기 위해 코드를 구분하는 투영 경계를 최적화 하는데 초점을 맞추고 있다. 하지만 이러한 해결책은 코드의 길이가 늘어날수록 얻는 정확도의 효율 감소와 양자화에서 비롯되는 높은 양자화 오류에 의해 성능 향상의 한계를 보인다.
본 논문에서는 양자화 오류와 효율 감소를 모두 줄이는 새로운 이진 코드 임베딩 방법인 Quadra-Embedding을 제안하였다. 이 방법은 한 투영 경계로 한 비트를 표현하던 기존의 방법들과 달리 한 투영 경계에 두 비트를 할당하여 4개의 상태를 표현한다. 또한 이 임베딩 방법에 알맞으며 양자화 오류를 획기적으로 줄이는 새로운 유사도 계산법을 제시한다. 이 방법은 기존 대부분의 이진 코드 임베딩 기술에 직접 적용할 수 있다. 이를 검증하기 위해 다양한 특성을 가지는 3개의 데이터에 대해 k-근접점 질의 (k-Nearest Neighbor Search)와 e-근접점 질의 (e-Nearest Neighbor Search)의 정확도를 측정하였고 이 방법은 기존의 방법들을 뛰어넘는 정확도를 보였다.