To design new preventive and therapeutic strategies for diseases, it is necessary to understand relationships between diseases and drugs in a variety of perspectives such as the clinical-centric and the molecular-centric approach. In such approaches, the information about clinical factors and gene expressions are used for intermediates that link diseases and drugs. In this regard, it is important to collect the accurate and specific information about relationships between biomedical entities (disease, clinical factor, gene expression, and drug) in order to precisely interpret disease-drug relationships. Most of this knowledge is available via the biomedicalliterature. In this thesis, we introduce machine-learning based text-mining frameworks to extract relationships between biomedical entities from the scientific publications.
질병에 대한 새로운 예방 및 치료전략을 수립하기 위해서는 다양한 관점에서의 질병-약물 관계이해가 필요하다. 이를 위한 연구전략으로는 임상중심 (Clinical-centric)적 및 분자중심 (Molecular-centric)적 접근방법이 존재한다. 두 접근 방식은 질병과 약물 사이 관계를 해석하기 위해 각각 임상학적 요소와, 유전자 발현정보를 매개체로서 이용한다. 따라서 보다 정확한 질병-약물 관계 해석을 위해서는 질병-매개체 및 매개체-약물 사이의 구체적인 관계정보가 필요하며,이러한 정보들은 문헌을 통해서 보고되고 있다. 본 학위논문에서는 문헌으로부터 생물의학적 요소(질병, 임상요소, 유전자 발현, 약물) 사이의 관계정보를 추출하기 위한 기계학습기반 텍스트마이닝 프레임워크에 대해서 다루고자 한다.