Query expansion is a well known method widely used to improve the efficiency and precision of information retrieval in diverse fields. Especially, it is important in medical domain due to the vastness of jargons and inconsistency of terms. However, query expansion in medical domain still falls behind general domain in number or diversity of research. In addition, a number of strategies that deal with this problem use medical ontology as their main source, which is an intensional approach, although it does not support diverse expressions. On the other hand, extensional approach is based on external resources such as documents. An intensional and extensional approaches have their own advantages and weaknesses. Thus in this paper, an integrated approach is proposed to overcome the weaknesses from intensional and extensional approach. This approach combines the both approaches and a synergy effect from the combination is expectable. To test the effectiveness of this framework, TREC-CDS Track 2014 data was used. The experiment result showed statistically significant improvement in retrieval performance. From this result, this integrated apporach can be rated as a viable soltion in query expansion for the medical domain.
질의 확장은 검색 성능의 향상을 목적으로 주어진 질의를 확장하는 기법으로, 상당 기간 연구되어 왔으며 검색의 효율성 및 정확성에 긍정적인 영향을 미친다는 사실이 알려져왔다. 하지만 특수한 도메인인 의학 도메인에 있어서는, 일반적인 도메인에 비해 연구된 바가 적다. 특히나 의학 도메인은 용어의 혼용문제가 있어 간단한 질의어만으로는 충분한 검색이 어렵기 때문에 질의 확장이 중요하다. 한편, 의학 도메인은 용어들에 대한 온톨로지가 잘 구축되어있어 질의 확장에 대한 연구질의 확장에 대한 연구의 많은 수를 온톨로지를 활용한 내포적 방식이 차지한다. 하지만, 온톨로지를 활용하는 내포적 방식의 질의 확장과 문서를 활용하는 외연적 방식의 질의 확장으로부터 얻을 수 있는 장단점이 다르며, 온톨로지만을 이용한 방식은 외연적 방식의 장점을 얻을 수 없다는 단점이 있다. 이에, 본 연구에서는 내포적 방식과 외연적 방식을 통합한 새로운 방식의 질의 확장법을 제안하였고, 실험을 통해 그 효과를 확인하였다.