Molecular graph is one of the spotlighted molecular representations as deep learning models, especially graph neural network (GNN) models, have recently been proposed to predict molecular properties and intermolecular interactions. A Molecular graph is defined as graph G(V,E), composed of nodes (i.e., atoms) and edges (i.e., bonds). Many researchers have proposed three-dimensional GNN models, using basic two-dimensional molecular graphs and additional descriptors for three-dimensional molecular information, these days. Despite all the studies, three-dimensional molecular descriptors such as bond distance and relational positions between atoms are only considered as molecular representations, and other three-dimensional molecular structural information is ignored in the molecular graph. In this work, we proposed three new descriptors for molecular graphs: full-electron-configuration vector, interatomic overlap area, and noncovalent molecular graph based on noncovalent interactions. We introduced a new combination of atom and bond descriptors, including the proposed descriptors, to predict solvation free energy of organic light-emitting diode (OLED) molecules as solutes. We also proposed MolNet, a chemically intuitive covalent-noncovalent multimodal three-dimensional GNN model which learns both covalent and noncovalent interactions in molecules, to predict the binding affinity between a protein and ligands complex and aqueous solvation free energy. The MolNet model showed higher prediction performance than earlier GNN models. The descriptors and the noncovalent molecular graph introduced in this work could be applied and adopted for other types of molecular representations, and the MolNet model could predict various molecular properties.
심층학습(deep learning), 특히 그래프 신경망 모델(graph neural network)을 이용한 분자의 물성 예측 및 분자 간의 상호작용 예측 연구가 증가하면서 분자 그래프(molecular graph)는 현재 가장 각광받는 분자 표현법 중 하나가 되었다. 분자 그래프는 분자를 형성하는 원자와 결합을 각각 노드(node)와 엣지(edge)로 갖는 그래프 형태로 정의한 것이다. 최근에는 일반적인 2차원 분자 그래프에 더하여 3차원 분자 정보를 나타낼 수 있는 표현자(descriptor) 및 이를 이용한 그래프 신경망 모델이 다양하게 연구되고 있다. 그럼에도 불구하고 결합 거리, 원자 간 상대 위치 등 제한적인 3차원 분자 구조 정보만이 분자 표현에 활용되고 있어 여전히 누락되는 분자 정보가 많은 실정이다. 본 연구에서는 전체 전자구조 및 원자 겹침 영역, 결합 극성에 대한 표현자와 비결합성 상호작용(noncovalent interaction)을 기반으로 한 비결합성 분자 그래프(noncovalent molecular graph)를 제안하였다. 우리는 기존의 용질-용매 분리 그래프 신경망 모델에 전체 전자구조 및 원자 겹침 영역, 결합 극성에 대한 표현자를 이용하는 새로운 원자 및 결합 표현자 조합을 적용함으로써 유기 발광 다이오드(organic light-emitting diode, OLED) 용질에 대한 용매화 자유 에너지를 예측하였다. 또한 단백질과 리간드 간 결합 친화도(binding affinity)와 수화 자유 에너지 예측 등에 활용 가능한 새로운 3차원 그래프 신경망 모델을 개발하기 위해 비결합성 분자 그래프를 도입한 몰넷(MolNet) 모델을 개발하여 기존 모델 대비 향상된 성능을 보고하였다. 본 연구에서 개발한 표현자 및 비결합성 분자 그래프, 몰넷 모델은 다른 종류의 분자 표현 및 다양한 분자 특성 예측에도 활용될 수 있을 것이다.