In this paper, we propose a drug-induced liver injury (DILI) prediction model that uses a graph convolutional network with novel architecture on a heterogeneous network consisting of drug-target and gene-gene interactions. Our model uses not only drug structure information but also information about interactions between drugs and genes. The model was trained on 1006 drugs, and the performance was evaluated by nested cross-validation. The model achieved Matthew’s correlation coefficient of 0.327 outperforming baseline models that use structure information only, and distinguished structurally similar but having different bioactivity drug pairs. DILI-related genes were selected based on the attention-based novel architecture of the model, and suggested previously undefined DILI mechanisms. Our model successfully integrated various information for predicting DILI and can be applied easily to other research fields due to its simplicity.
본 논문에서는 약물-표적 및 유전자-유전자 상호 작용으로 구성된 이종 네트워크에서 새로운 구조를 가진 그래프 합성곱 신경망을 사용하는 약인성 간손상 예측 모델을 제안한다. 본 연구의 모델은 약물 구조 정보뿐만 아니라 약물과 유전자 간의 상호 작용에 대한 정보도 사용한다. 이 모델은 1006 개의 약물에 대해 훈련되었으며 성능은 중첩 교차 검증을 통해 평가되었다. 이 모델은 구조 정보만 사용하는 기준 모델을 능가하는 Matthew 상관 계수 0.327의 성능을 보였으며, 구조적으로 유사하지만 다른 생물 활성을 가지는 약물 쌍을 구별해내었다. 어텐션 기반의 모델의 새로운 구조에 기반하여 약인성 간손상 관련 유전자들이 선택되었고, 이전에 정의되지 않은 약인성 간손상 메커니즘을 제시했다. 본 연구의 모델은 약인성 간손상 예측을 위해 다양한 정보를 성공적으로 통합했으며, 모델의 단순성으로 인해 다른 연구 분야에 쉽게 적용 할 수 있다.