Keyword search has been popularly used in searching for documents and web pages. Recently, there has been much work on supporting keyword search for structured data such as relational data or XML data. The advent of the Semantic Web has brought a new source of structured data, i.e., graph-structured RDF data. Keyword search on the RDF data allows users to search information without user`s knowledge of underlying RDF ontology structure and query language such as SPARQL. However, applying previous keyword search techniques to RDF data is not appropriate due to the difference in the underlying data structures, or the existing techniques` ignorance of the semantics in RDF data.
In this paper, we propose an effective keyword search method for RDF data, which returns subgraph with keywords utilizes information in RDF data for keyword search. First, this paper transforms RDF ontology by clustering resources to meaningful units, which allows more efficient search and effective ranking. In addition, this paper ranks nodes and edges in an RDF data graph based on information in the RDF data graph. This allows the search results to closely reflect information in the RDF data. The experimental results show that the proposed search method is faster and more effective compared to previous keyword search methods.
키워드 검색은 문서나 웹페이지를 찾기 위한 인기 있는 검색 방법 중 하나이다. 최근에는 관계형 데이터베이스나 XML 데이터와 같은 구조화된 데이터에 대한 키워드 검색을 지원하는 연구가 이뤄지고 있다. 시맨틱 웹의 등장으로 그래프 구조를 가지는 RDF 데이터가 생겨났다. RDF 데이터에 키워드 검색을 지원하면 사용자는 내부 RDF 온톨로지 구조나 SPARQL과 같은 질의 언어를 몰라도 정보를 검색할 수 있게 된다. 하지만 기존 키워드 검색 연구는 내부 구조가 상이하거나 RDF의 특성을 고려하지 못해 RDF 데이터에 적절하게 활용할 수 없다. 본 논문에서는 RDF 데이터에 대한 효과적인 키워드 검색 기법을 제안한다. 이 기법은 RDF 데이터에 기술된 정보를 활용해 키워드를 포함하는 서브 그래프를 반환해준다. RDF의 자원들을 의미 있는 유닛으로 클러스터링을 하는 RDF 온톨로지 변환 단계를 수행해 효율적인 검색과 효과적인 랭킹을 지원하고 RDF 그래프의 노드와 에지에 적절한 점수를 부과하여 RDF 데이터의 정보를 더욱 반영할 수 있도록 한다. 본 논문은 실험을 통해 이전 검색 기법을 활용하였을 때보다 빠르고 효과적인 검색을 지원함을 보인다.