서지주요정보
PHS : a priority-based hyperlink search algorithm for automatic web information discovery = HPS
서명 / 저자 PHS : a priority-based hyperlink search algorithm for automatic web information discovery = HPS : 웹정보 검색을 위한 우선순위 기반 하이퍼링크 탐색기법 / Dong-Won Lee.
발행사항 [대전 : 한국정보통신대학교, 2003].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000374

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS03-69 2003

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Information gathering on the Web is based on hyperlink traversal. Especially, topic-based information search and extraction is an important technique to support many new services on the Web. In this paper, we propose a webpage traversal algorithm called a Priority-based Hyperlink Search(PHS) which uses a set of well-defined rules to determine the traversal direction over webpages based on the priority ranks of respective hyperlinks. The prioritization rules are modeled based on human user's webpage navigation behaviors of hyperlink traversal. During the traversal, all the hyperlinks in the present webpage are given priorities according to the priority rules so that the overall traversal flow moves toward the webpages with higher probabilities of containing matching information to the topic of search interest. To determine the priority of hyperlink, the PHS divide the webpage into basic information units using similarity thesaurus. The algorithm terminates by dynamically measuring the statistical matching trend on each traversal. This allows application designers to design services with a faster and more accurate information gathering. Web application designers (or application users) can choose the levels of information collection for the purpose of their applications. We carried out a performance evaluation and analysis on the proposed algorithm in comparison with other algorithms using a test document with an answer set and a query set.

웹은 정보의 접근성과 다양성으로 인하여 새로운 정보 시스템으로 널리 이용되게 되었다. 이러한 웹에서 정보를 수집하는 방법은 하이퍼링크를 탐색하는 방법에 기반하고 있다. 그러나, 웹의 급속한 발전으로 인하여 기존의 하이퍼링크 탐색기법을 이용하여 웹 정보를 수집하는 것은 비효율적이 되었다. 그리고, 기존 검색엔진의 문제점으로 인하여 최근에는 특정영역의 정보만을 검색하거나 추출하는 기술이 웹 상의 새로운 서비스를 위한 중요한 기술 중에 하나가 되었다. 본 논문에서는 특정영역의 정보만을 탐색할 수 있는 하이퍼링크 우선순위 탐색 알고리즘을 제안하였다. 하이퍼링크 우선순위 탐색 알고리즘은 기존의 웹 검색 알고리즘과 달리 사용자의 웹을 탐색하는 방법에 기반하여 정의된 규칙을 이용하여 웹 페이지상의 하이퍼링크의 우선순위를 부여하고, 부여된 우선순위에 따라 탐색의 방향을 결정하도록 설계되었다. 탐색을 하는 동안 알고리즘은 탐색의 목적에 맞는 정보가 많을 것으로 예상되는 하이퍼링크에 높은 우선순위가 부여되도록 하였다. 또, 제안된 알고리즘은 유사한 목적을 가지고 설계된 Shark-search 알고리즘이 웹을 탐색 하는 동안 하이퍼링크 우선순위를 부여하기 위하여 많은 계산을 수행하는 것과 달리 미리 정의된 규칙에 따라 하이퍼링크에 우선순위를 부여함에 따라 보다 빠른 검색이 가능하게 하였다. 하이퍼링크 우선순위 탐색 알고리즘은 웹을 탐색하는 동안 웹페이지에 포함된 모든 하이퍼링크에 우선순위를 부여함에 따라, 사용자가 원하는 정보가 더 많은 쪽으로 탐색을 계속할 수 있도록 하였다. 그리고, 웹페이지를 여러 개의 작은 조각으로 나누어서 하이퍼링크의 우선순위를 부여할 수 있도록 설계하였으며, 탐색 알고리즘의 종료를 위하여 통계적 방법을 이용하여 사용자가 원하는 정보가 검색되는 정보의 양에 따라서 종료할 수 있는 방법을 제안하였다. 본 논문에서 제안한 하이퍼링크 우선순위 탐색 알고리즘은 의료정보검색 시스템, 디지털 도서관 등 특정 영영 검색 시스템, 웹 브라우징 보조 시스템, 개인화 정보 정보검색 시스템 등 다양한 웹 정보 검색 및 관리시스템에 이용될 수 있다.

서지기타정보

서지기타정보
청구기호 {ICU/MS03-69 2003
형태사항 vii, 65 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이동원
지도교수의 영문표기 : Soon-Joo Hyun
지도교수의 한글표기 : 현순주
학위논문 학위논문(석사) - 한국정보통신대학원대학교 : 공학부,
서지주기 References : p. 58-63
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서