서지주요정보
Content-based retrieval in distributed image databases = 분산된 이미지데이타베이스들에서의 내용기반검색
서명 / 저자 Content-based retrieval in distributed image databases = 분산된 이미지데이타베이스들에서의 내용기반검색 / Deok-Hwan Kim.
발행사항 [대전 : 한국과학기술원, 2003].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8014455

소장위치/청구기호

학술문화관(문화관) 보존서고

DICE 03002

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

등록번호

9009521

소장위치/청구기호

서울 학위논문 서가

DICE 03002 c. 2

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Image databases on the Web have heterogeneous characteristics since they use different similarity measures and queries are processed depending on their own schemes. In the content-based image retrieval from distributed sites, it is crucial that the metaserver has the capability to find objects, similar to a given query object in terms of the global similarity measure, from different image databases with different local similarity measures. First, we investigate (1) the problem of finding databases, which contain more objects relevant to a given query than other databases, from many image databases dispersed on the Web, and (2) the problem of retrieving relevant images by content-based retrieval from selected image databases. The former is referred to as a database selection problem and the latter is referred to as a collection fusion problem. We introduce a new selection method to determine candidate databases. The selection of databases is based on the hybrid estimator using a few sample objects and compressed histogram information of image databases. The histogram information is used to estimate the selectivity of spherical range queries and a small number of sample objects are used to compensate the selectivity error due to the difference of the similarity measures between metaserver and image databases. The collection fusion of image databases is concerned with the merging of results retrieved by content-based retrieval from heterogeneous image databases on the Web. We also propose new collection fusion methods using two heuristic estimators: average ranking and average global similarity, the ordinary regression model, and the Bayesian regression model. Among them, the probabilistic technique using Bayesian regression model outperforms the other approaches for diverse sizes of result sets for a query. Its improvement in effectiveness becomes especially large with small sizes of result sets. And, we present a virtual optimal algorithm to which our algorithm is compared. Extensive experiments show that our proposed methods perform well in the distributed heterogeneous environment. Next, we investigate a new approach to the multipoint relevance feedback. Few methods using the relevance feedback are currently available to process relatively complex queries on large image databases. In the case of complex image queries, the feature space and the distance function of the user`s perception are usually different from those of the system. This difference leads to adapting multiple clusters (i.e., regions) to represent a query in the feature space. Therefore, it is necessary to handle disjunctive queries in the feature space. We propose a new content-based image retrieval method using adaptive classification and cluster-merging to find multiple clusters of a complex image query. Our method achieves the same high retrieval quality regardless of the shapes of clusters of a query since the measures used in our method are invariant under linear transformations. Extensive experiments show that the result of our method converges to the user`s true information need fast, and the retrieval quality of our method is better than those of the query expansion and the query point movement approach in MARS.

웹상의 이미지 데이타베이스들은 서로 다른 유사성 측정 함수와 질의처리방법을 사용하기 때문에 이질적인 특성을 가지고 있다. 다른 유사성 측정함수를 갖는 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서 메타 서버는 사용자가 정의한 유사성 측정함수에 의하여 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것이 중요하다. 본 논문에서는 첫째, 웹상의 많은 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 선택하는 방법과, 선택된 데이타베이스들로부터 내용기반 검색된 유사한 이미지들을 수집 융합하는 방법을 제안한다. 제안된 데이타베이스 선택방법은 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 히스토그램 정보는 구형 영역질의에 대한 선택률을 추정하기 위해 사용되며, 표본 객체들은 메타서버와 이미지 데이타베이스들간의 유사성 측정함수의 차이에 의한 선택률 오차를 보정하기 위하여 사용된다. 제안된 수집융합 방법들은 평균 순위와 평균 전역 유사도와 같은 두 휴리스틱 추정기법들, 선형 회귀 모델과 베이지안 회귀 모델에 기반을 두고 있다. 또한, 비교를 위하여 가상적인 최적 알고리즘을 제시한다. 이들중, 베이지안 회귀 모델을 사용하는 기법이 질의에 대한 다양한 크기의 결과들에 대하여 다른 기법들보다 우수한 성능을 나타낸다. 특히, 작은 크기의 결과에 대하여 효율성이 매우 크게 증가한다. 광범위한 실험들에 대한 결과는 본 논문에서 제시된 방법들이 이질적인 분산 환경에서 효율적임을 보여주고 있다. 적합성 피드백을 이용한 학습은 최근에 내용기반 이미지 검색에서 가장 활발한 연구 분야가 되고 있다. 그러나, 현재까지 대용량 이미지 데이타베이스에서 연관 피드백에 의해 상대적으로 복잡한 질의들을 수행할 수 있는 방법이 거의 없다. 복잡한 이미지 질의의 경우, 사용자 인식을 위한 특징 공간과 거리함수가 시스템을 위한 특징 공간과 거리함수와 차이가 있기 때문에, 검색된 이미지들중 사용자에 의해 피드백된 이미지들이 특징공간에서 임의의 형태를 갖는 여러개의 군집 (영역)들로 사상된다. 따라서, 특징공간에서 따로 떨어진 군집들을 찾고 논리합 질의를 다룰 수 있어야 한다. 본 논문에서는 복잡한 이미지 질의를 표현하는 여러개의 군집들을 찾는 적응성있는 분류와 군집-합병 방법을 이용한 내용기반 이미지 검색 방법을 제안한다. 선형 변환 불변성을 갖는 함수를 사용하는 검색 방법은 질의 영역들의 형태에 관계없이 같은 검색 성능을 유지할 수 있다. 제안한 방법은 이런 성질을 갖는 함수를 사용하기 때문에 질의 영역들의 형태에 관계없이 일정하게 높은 검색 성능을 유지한다. 다양한 실험은 제시된 방법의 결과가 사용자가 찾고있는 목표에 빠르게 수렴함을 보이며, 검색성능이 MARS의 질의점 이동 방법과 질의 확장 방법보다 우수함을 보여주고 있다.

서지기타정보

서지기타정보
청구기호 {DICE 03002
형태사항 x, 117 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김덕환
지도교수의 영문표기 : Chin-Wan Chung
지도교수의 한글표기 : 정진완
수록잡지명 : "Collection fusion using bayesian estimation of a linear regression model in image databases on the web". Information processing & management, (2003)
수록잡지명 : "Heterogeneous image database selection on the web". Journal of systems and software, (2003)
학위논문 학위논문(박사) - 한국과학기술원 : 정보및통신공학학제전공,
서지주기 Reference : p. 110-117
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서