서지주요정보
Automatic rule acquisition through ontology from the web : XRML approach = 온톨로지를 활용한 웹으로부터의 자동화된 규칙습득 : XRML 접근방식
서명 / 저자 Automatic rule acquisition through ontology from the web : XRML approach = 온톨로지를 활용한 웹으로부터의 자동화된 규칙습득 : XRML 접근방식 / Sang-Un Park.
저자명 Park, Sang-Un ; 박상언
발행사항 [대전 : 한국과학기술원, 2006].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8017832

소장위치/청구기호

학술문화관(문화관) 보존서고

DGSM 06014

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

As research on the Semantic Web actively progresses, a more intelligent Web environment is expected for the next generation in various domains including rule based systems and intelligent agents. However, rule acquisition is still a bottleneck in the utilization of the rule based systems. To extract rules from Web pages and maintain consistency between them, the framework of XRML (eXtensible Rule Markup Language) has been developed. XRML allows the identification of rules from Web pages and generates the identified rules automatically. The important feature of XRML is that rule identification provides a significant level of automation in rule generation. However, the knowledge engineer’s burden is still high because rule identification requires considerable manual work. In order to reduce the knowledge engineer’s burden in rule acquisition, we have suggested a rule identification methodology through ontology based on the XRML approach. As the first step of our approach, we showed the role of ontology in rule acquisition and described various issues on using ontology such as the necessity of a specified ontology for rule acquisition, the degree of ontology expression for rules, the method of applying ontology in rule acquisition, and the management of ontology scope. Also we designed an ontology for rule acquisition named OntoRule because the ontology can substitute for the knowledge engineer’s experience based on these issues. For the second step, we proposed a rule acquisition procedure that automatically identifies rule components such as variables and values from the Web page by using OntoRule. Moreover, we proposed the best-first search algorithm that automatically composes rules from the identified variables and values through OntoRule. We also described various issues and further research topics on using OntoRule and the best-first search for rule acquisition. The knowledge engineer completes rule acquisition by adding those missing components and correcting misidentified components because the automatic rule acquisition is not complete. For the final step of our approach, we evaluated the effect of using ontology in rule identification with experiments that acquire rules from two online bookstores - BarnesAndNoble.com and Powells.com - by using OntoRule that was constructed from Amazon.com. We calculated the number of wrong and missed recommendations in our approach for rule components involving variables, values, IF, THEN, and rules. In the experiment, our methodology could recommend up to 92.85% of the final variables and values with 93.87% accuracy.

시맨틱 웹 관련연구가 증가함에 따라 지능형 에이전트 혹은 규칙기반 시스템 등의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 그러나 규칙기반 시스템의 활용에는 아직도 규칙습득이 많은 제약이 되고 있다. 이와 같은 제약을 극복하기 위해 웹 페이지로부터 규칙을 습득하기 위한 XRML 방법론이 제안되었다. XRML 방법론은 웹 페이지로부터 규칙을 식별하고 식별된 결과로부터 자동으로 규칙을 생성하는 두 단계로 구성되어 있다. 여기서 규칙의 식별은 규칙생성의 자동화 정도에 매우 중요한 영향을 미친다. 그러나 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의존하고 있다. 이러한 지식관리자의 부담을 줄이기 위해 본 논문에서는 온톨로지 기반의 개선된 규칙식별 방법론을 제안하고자 한다. 연구의 첫 단계로 우선 규칙습득에서의 온톨로지의 역할과, 규칙습득과정에서 온톨로지를 사용하는데 있어 발생할 수 있는 다양한 논점들을 제시하였다. 이러한 논점으로는 온톨로지 학습효과, 하향식 접근방식과 상향식 접근방식의 차이, 온톨로지 사용범위 관리, 규칙구성요소의 식별순서, 생략된 변수의 식별이 있다. 다음 단계로 규칙습득과정에서 사용되는 온톨로지를 이상의 논점들을 바탕으로 하여 OnroRule이라는 이름으로 설계하였다. 그리고 이러한 온톨로지를 생성하기 위한 과정을 정의하였다. 셋째 단계로 OntoRule을 이용하여 웹페이지로부터 변수 혹은 변수값과 같은 규칙의 구성요소들을 자동으로 식별하는 절차를 제안하였다. 그리고 식별된 규칙 구성요소들을 조합하여 자동으로 규칙을 구성하기 위한 온톨로지 기반의 최적우선탐색 알고리즘을 제안하였다. 또한 규칙의 자동습득과정에서 온톨로지와 최적우선탐색을 사용하기 위해 고려하여야 할 다양한 논점들과 향후 연구방향을 제시하였다. 지식관리자는 잘못 식별된 규칙구성요소들을 수정하고, 식별되지 못한 규칙구성요소들을 추가함으로써 규칙식별을 완료할 수 있다. 본 연구의 마지막 단계로 두 개의 온라인 서점 - BarnesAndNoble.com과 Powells.com - 으로부터 규칙을 습득하는 실험을 통하여 본 연구에서 제안된 방법론의 효과를 평가하였다. 실험에서는 잘못 식별된 규칙구성요소들의 수와 식별되지 못한 규칙구성요소들의 수를 각각 변수, 변수값, 규칙, IF와 THEN에 대하여 계산함으로써, 각 규칙구성요소에 대해 본 연구에서 제안된 접근방식의 효과를 측정하였다. 실험 결과, 웹 페이지가 실재로 내재하고 있는 변수와 변수값의 92.85%를 자동으로 식별할 수 있었으며, 추천된 변수와 변수값 중에서 93.87%는 올바르게 식별된 값이었다.

서지기타정보

서지기타정보
청구기호 {DGSM 06014
형태사항 viii, 132 p. : 삽도 ; 26 cm
언어 영어
일반주기 Appendix : A, Generalized rule ontology from amazon.com. - B, Acquired rules from BN.com. - C, Acquired rules from powells.com
저자명의 한글표기 : 박상언
지도교수의 영문표기 : Young-Gul Kim
공동교수의 영문표기 : Jae-Kyu Lee
지도교수의 한글표기 : 김영걸
공동교수의 한글표기 : 이재규
학위논문 학위논문(박사) - 한국과학기술원 : 경영공학전공,
서지주기 Reference : p. 92-99
주제 XRML
Ontology
Semantic Web
Rule Acquisition
Best First Search
확장형규칙표식언어
온톨로지
시맨틱 웹
규칙습득
최적우선탐색
QR CODE qr code