Traditional new drug development is difficult due to the burden of time and cost, and the risk of failure. Drug repurposing has the advantage that the success rate is relatively higher because it starts with a low risk related to drug safety or pharmacokinetics. With the advent of heterogeneous biomedical large-scale data, drug repurposing through in silico has become possible, but there is a difficulty in properly utilizing the heterogeneous characteristics of the data. In this paper, I propose a knowledge graph-based drug repurposing model, DRRE, that utilizes heterogeneous characteristics of biomedical data. The DRRE model learns topological features through GCN and reconstructs eight interactions. In particular, the heterogeneous characteristics of interactions are taken into account by introducing embeddings for each relation type. DRRE performed better than other heterogeneous graph-based models in predicting drug-disease interactions, and the fact that the DRRE performance was higher than the excluded model proved the effectiveness for relation type-specific embedding. In predicting drug candidates for Alzheimer’s disease conducted as a case study, three out of the top ten candidates predicted by DRRE have demonstrated efficacy in the literature.
기존의 신약 개발은 시간과 비용의 부담과 실패의 위험 때문에 어렵습니다. 약물 용도 변경은 약물 안전성이나 약동학과 관련된 낮은 위험도에서 시작하기 때문에 성공률이 상대적으로 높다는 장점이 있다. 이기종 생물의학 대규모 데이터의 출현으로 in silico를 통한 약물 용도 변경이 가능하게 되었지만, 데이터의 이기종 특성을 적절히 활용하는 데 어려움이 있습니다. 본 논문에서는 생물의학 데이터의 이기종 특성을 활용한 지식 그래프 기반 약물 용도 변경 모델인 DRRE를 제안한다. DRRE 모델은 GCN을 통해 토폴로지 기능을 학습하고 8개의 상호 작용을 재구성합니다. 특히, 각 관계 유형에 대한 임베딩을 도입하여 상호 작용의 이질적인 특성을 고려합니다. DRRE는 약물-질병 상호작용 예측에서 다른 이종 그래프 기반 모델보다 우수한 성능을 보였고, DRRE 성능이 제외된 모델보다 높다는 사실은 관계 유형별 임베딩에 대한 효과를 입증했습니다. 사례 연구로 수행된 알츠하이머병 후보 약물 예측에서 상위 10개 중 3개가 문헌에서 효능을 입증했습니다.