Predicting the synthesizability of inorganic materials is one of the major challenges in accelerated material discovery. Considering simple thermodynamic decomposition stability due to its simplicity of computing is notorious for either producing too many candidates or missing important metastable materials. These results, however, are not unexcepted since the synthesizability is a complex phenomenon, and thermodynamic stability is just one contributor. Here, we suggest a machine-learned model to quantify the probability of synthesis based on partially supervised learning of materials database. We adapted the positive and unlabeled machine learning (PU-learning) by implementing graph convolutional neural network as a classifier, in which the model outputs synthesizability score. The model shows promising prediction accuracy for the test set of experimentally reported cases. The analysis shows that our model captures the chemical features for synthesizability beyond that is possible by thermodynamic stability. With the proposed data-driven metric of synthesizability score, high-throughput virtual screening and generative models can benefit significantly by effectively reducing the chemical space that needs to be explored experimentally in the future towards more rational materials design.
무기 소재의 합성 가능성을 예측하는 것은 소재 개발 가속화를 위해 중요한 도전 요소 중 하나이다. 열역학적 분해 안정성을 고려하는 방법은 가능한 후보군을 너무 많이 만들어내거나, 준안정 상태의 중요 물질들을 놓치는 경우가 많은 것으로 알려졌다. 소재의 합성 가능성이란 매우 복잡한 현상이고, 열역학적 안정성은 그 중 하나의 요소에 불과하기 때문이다. 이에 본 학위논문에서는 기존 소재 데이터베이스를 이용한 준지도학습을 통해 합성 가능성을 정량화하는 기계학습 모델을 개발했다. 분류기로 그래프 합성곱 신경망 등을 사용하고 positive and unlabeled 기계학습 (PU 학습)을 적용하여 모델이 합성 가능성 점수를 출력하도록 한다. 본 연구에서는 준수한 정확도로 합성 가능한 구조들을 예측할 수 있었고 개발된 모델이 합성 가능한 소재들의 고유한 화학적 특성을 포착했다는 것을 보여주었다. 제안된 데이터 기반의 척도를 이용하여 가상 대량 스크리닝이나 생성 모델에서 실험으로 탐색되어야 하는 화학 공간을 매우 효과적으로 줄여 상당한 이익을 얻을 수 있을 것으로 기대한다.