서지주요정보
Improvement of image retrieval accuracy based on incremental vocabulary tree using chain feature selection algorithm = 연쇄 특징정보 추출 방법을 이용한 점진 어휘 트리 기반의 이미지 반환 정확도 개선
서명 / 저자 Improvement of image retrieval accuracy based on incremental vocabulary tree using chain feature selection algorithm = 연쇄 특징정보 추출 방법을 이용한 점진 어휘 트리 기반의 이미지 반환 정확도 개선 / Ho-Yong Seo.
저자명 Seo, Ho-Yong ; 서호용
발행사항 [대전 : 한국과학기술원, 2011].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8022661

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 11048

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Any task of robot consists of three steps such as recognition, decision and action sequentially. Among them, decision step should be performed after modifying input data for current task as suitable as possible. In the case of data categorization task, we can define classifier which means the decision step module which can determine the class of given query data. Especially, robot system requires correct decision technique for object such as human, material and other environments when some input image informations are given. This is why object recognition field experiences pretty much spotlight recently. Because of fast improvement for information process and data mining skill, main concerning is concentrated on real-time classifier maintaining proper object recognition performance. The one of representatives in real-time classifier is Incremental Vocabulary Tree. There is two characteristics at this structure. First, this classifier doesn`t require pre-defined classes for constructing and training process because it uses hierarchical k-means clustering. So, this classifier is based on contents based image retrieval. Second, when new image is inserted continuously, this structure could increase or decrease the size of node to adapt the information from new query image and maintain own size as possible. But, maintaining proper retrieval performance also requires large number of nodes and that number could change slightly when we perform decision process. This is why incremental vocabulary tree based on local feature have had a problem with the respect of combination global features such as color feature, texture feature and etc. In this thesis, we propose feature selection method for incremental vocabulary tree to select super nodes which can make big difference between training images and fix the size of those useful nodes. Although existing feature selection method have been known, those method could not consider about large number and large size of feature such as SIFT local feature extracted from a image. In this thesis, by using TF-IDF weighting method which is used for calculating score value, we could find super leaf nodes which are expected to give best retrieval performance. To do this, not only including highest weight as possible but also maximizing the weight difference between image contained specific node is proposed. Using new method, we can get better retrieval performance by some small and fixed size nodes so called super leaf nodes. Increment of time complexity is almost negligible. Also, we can make easier connection with global feature because proposed method returns fixed size result vector.

로봇의 작업은 크게 인지, 판단, 행동의 3단계로 이루어진다. 특히, 판단의 경우 인지되어 들어온 데이터를 필요한 목표에 맞게 가공한 후 이루어지는데, 데이터 분류 작업의 경우 분류 판단을 수행하는 가공 모듈을 분류기(Classifier)라 정의한다. 특히 이미지 데이터로부터 물체나 사람, 환경 등을 제대로 분류하여야 제대로 된 행동을 취할 수 있기 때문에, 소위 물체 인식(Object Recogntion)이라 불리는 분야의 중요성이 아주 크다. 최근에는 정보 처리 능력의 발달에 힘입어 대량의 데이터를 실시간으로 처리할 수 있는 분류기에 관한 관심이 증폭되고 있는데, 점진적 어휘 트리(Incremental Vocabulary Tree)는 대표적인 대량의 이미지 분류에 사용되는 분류기 중 하나이다. 이 구조는 크게 두 가지 특징이 있는데, 첫 번째로는 미리 분류 목록(class)를 지정하지 않고 단순히 이미지로부터 나오는 특징점 정보로 이미지 유사성을 판단하고 회수(Image Retrieval)한다는 것이다. 두 번째로는 계층적 K-mean 분류법(Hierarchical K-means Clustering)을 사용하여 트리 구조를 구성하고, 계속적으로 이미지가 들어올 때마다 트리의 노드 개수를 늘리거나 줄이면서 이미지의 개수가 증가하더라도 그 성능을 최대한 유지하는 특징이 있다. 다만, 지속적인 이미지 증가에 따라 점진적 어휘 트리가 반환하는 데이터의 크기가 크고 그 크기가 계속적으로 변하기 때문에, 색깔 특징정보와 같은 광역 특징정보(Global Feature)와 연동시키기가 어려운 단점이 있다. 본 학위논문은 기존 점진적 어휘 트리가 반환하는 데이터의 크기를 고정시키기 위해 가장 이미지를 잘 분류시킬 수 있다고 판단되는 데이터, 즉 우량 데이터를 추려내는 방법을 제안하고자 한다. 기존에도 우량 데이터를 선택하는 방식이 존재해 왔지만, 그 방식들은 대량의 특징정보, 그리고 차원이 큰 특징정보에 관해서는 계산시간 문제로 인해 당면한 문제에서는 사용하기가 어렵다. 본 학위논문에서는 트리 구성 과정에서 계산되는 TF-IDF 방식의 가중치 산출 방식을 이용하여, 트리의 최종 노드(Leaf node) 중 특징정보를 적절하게 포함한다고 생각되는 우량 노드만을 선택하는 방법을 제안하고자 한다. 단순히 높은 점수를 가진 노드가 아닌, 이미지간의 점수 차이까지 극대화시켜주는 노드를 선택하는 방식이다. 이 방법을 이용하면 더 적은 수의, 고정된 데이터만으로도 기존에 반환된 데이터보다 더 우월한 이미지 회수 성능을 얻을 수 있으며, 계산 시간은 기존 방법에 비해 별 차이가 나지 않게 된다. 더불어, 트리 구조가 반환하는 데이터의 크기를 고정시키기 때문에 광역 특징정보와 더 쉽게 연계시킬 수 있게 된다.

서지기타정보

서지기타정보
청구기호 {MEE 11048
형태사항 vii, 49 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 서호용
지도교수의 영문표기 : Ju-Jang Lee
지도교수의 한글표기 : 이주장
학위논문 학위논문(석사) - 한국과학기술원 : 전기 및 전자공학과,
서지주기 References : p. 45-46
주제 Incremental Vocabulary Tree
Object Recognition
Image Retrieval
TF-IDF Weighting
Feature Selection
점진적 어휘 트리
물체 인식
이미지 회수
TF-IDF 가중치
특징정보 선택
QR CODE qr code