(A) knowledge based information retrieval model with hierarchical-concept graph = 계층적 개념 그래프를 이용한 지식기반 정보검색 모델
서명 / 저자 (A) knowledge based information retrieval model with hierarchical-concept graph = 계층적 개념 그래프를 이용한 지식기반 정보검색 모델 / Young-Whan Kim.
발행사항 [대전 : 한국과학기술원, 1990
DCS 9001

Conventional information retrieval models, such as Boolean model, vector model, fuzzy set model, and extended Boolean model, have not exploited knowledge from hierarchical thesaurus directly for the query evaluation process. Hierarchical thesaurus represents hierarchical relationships between index terms. With an inference mechanism utilizing inter-term relationships in hierarchical thesaurus, we can improve the retrieval effectiveness of information retrieval system. This thesis discusses a knowledge based information retrieval model with hierarchical thesaurus. The model computes the conceptual distance between a query and an object, both are indexed with weighted terms from a hierarchical thesaurus. The hierarchical thesaurus is represented by a Hierarchical-Concept Graph (HCG) in which nodes represent concepts and directed edges represent "generalization" relationships. Rada et al. have developed a similar model. However, their model considered only a binary indexing scheme and revealed some counter-intuitive results. The proposed model extends theirs to allow the index term and the edge of HCG to be weighted. A new concept mapping method is devised to overcome Rada's counter-intuitive results. In addition, a scheme for allowing Boolean operators in user queries is provided with a formula for computing conceptual distance from negated index terms. Experimental results have shown that the model simulates human performance more closely than Rada's model. The application to the Common LISP library system reveals that the proposed model is attractive for practical applications.

기존의 정보검색 모델들은 계층적인 시소러스의 지식을 질의어 평가과정에 직접적으로 사용하지 않았다. 만약 계층적 시소러스에 나타나는 색인어들간의 상관관계를 이용할 수 있는 효과적인 추론방법이 있다면 이를 이용하여 정보검색의 효율을 향상시킬 수 있을 것이 다. 본 논문에서는 계층적 개념 그래프를 이용한 정보검색 모델을 제안하였다. 계층적 개념 그래프(HCG)는 색인어들간의 상관관계를 나타내는 지식 베이스로서 노드는 색인어를 나타내고 에지는 두 노드들간의 "일반화(generalization)" 관계를 나타낸다. HCG상에서 두 노드를 연결하는 최단경로의 길이는 두 노드간의 개념적인 거리를 나타내게 된다. 제안된 모델에서는 HCG의 지식을 이용하여 색인어와 이의 가중치로써 표현되는 사용자 질의어와 각 정보요소들간의 개념적인 거리를 구함으로써 각 정보요소들의 적합도를 판정하였다. 색인어의 가중치가 허용되지 않는 이진 색인 방법을 택한 Rada의 모델과 비교할때, 제안한 모델은 색인어의 가중치를 허용하는 가중 색인 방법을 허용하였고 HCG의 에지도 "일반화" 관계의 세기에 따라 가중치를 부여할 수 있도록 하여 그들의 모델을 확장하였으며, 또한 새로운 개념 대응 방법을 고안함으로써 Rada의 모델에서 발생되는 직관적으로 설명 할 수 없는 결과를 방지할 수 있었다. 그리고 부정된 색인어로부터의 개념적인 거리를 구하는 보다 효과적인 방법을 개발하여 사용자 질의어에 부울리언 연산자를 사용할 수 있도록 하였다. 사람의 적합도 판정과 유사도를 측정한 실험 결과 제안된 모델이 Rada의 모델보다 훨씬 사람의 판정과 비슷함을 확인할 수 있었고, 응용 시스템으로 Common LISP 라이브러리 시스템을 개발하여 제안한 모델의 실용가능성을 탐색하였다.


청구기호 {DCS 9001
형태사항 [viii], 117 p. : 삽화 ; 26 cm
언어 영어
일반주기 Appendix : 1, Test data for the evaluation of the distance. - 2, Test data for the evaluation of the negation handling function
저자명의 한글표기 : 김영환
지도교수의 영문표기 : Jin-Hyung Kim
지도교수의 한글표기 : 김진형
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 Reference : p. 87-100
주제 Expert systems (Computer science)
정보 검색 시스템. --과학기술용어시소러스
지식 베이스 시스템. --과학기술용어시소러스
Informational storage and retrieval systems.





