This thesis presents the development of three graph-based machine learning (ML) models for single-step retrosynthesis, reaction outcome prediction, and atom-to-atom mapping (AAM) in the field of organic chemistry. The models, namely LocalRetro, LocalTransform, and LocalMapper, are designed following chemist-intuition to enhance their interpretability and performance. For each specific reaction task, we carefully design reaction templates with varying levels of simplifications to maximize their applicability while minimizing resolution requirements. Extensive experiments conducted on widely used USPTO reaction datasets demonstrate the superiority of our models over previous methods. These improvements can be attributed to the incorporation of chemist-intuitive design principles, which are suggested by our comprehensive analysis. Moreover, we showcase the potential of chemist-intuitive model design by introducing LocalRetro-mp, an advanced model that leverage both retro- and forward-synthesis predictions. This model enables more diverse and feasible synthesis planning, thereby enhancing the capabilities of retrosynthesis prediction. Overall, the results presented in this thesis highlight the benefits of incorporating chemist-intuition into ML models for reaction prediction in organic chemistry. The findings not only contribute to the advancement of the field but also pave the way for future research in leveraging chemist-intuitive design principles for further improvements in synthesis planning and other related areas.
본 논문에서는 유기 화학 분야에서의 단계별 역합성, 반응 결과 예측 및 원자 간 매핑 (AAM)을 위한 세 개의 그래프 기반 기계 학습 (ML) 모델을 개발하였습니다. 위 모델들인 LocalRetro, LocalTransform 및 LocalMapper는 연구자의 직관을 따르는 설계를 통해 해석 가능성과 예측 성능을 극대화시킵니다. 반응 템플릿은 각 태스크에 대해 효용성을 극대화할 수 있도록 신중하게 설계되었습니다. 광범위한 USPTO 반응 데이터셋에서 수행한 실험 결과, 이러한 모델들이 이전 방법들보다 우수한 성능을 보여주었습니다. 이러한 개선은 연구자의 직관적 설계 원칙을 모델에 효과적으로 통합함으로써 얻어진 것으로 분석됩니다. 뿐만 아니라, 본 논문에서는 역반응 및 정반응 예측을 결합한 LocalRetro-mp 라는 고급 모델을 소개하여 다양하고 실현 가능한 합성 계획을 제시하였습니다. 이를 통해 역합성 예측의 기능을 향상시킴으로써 더욱 다각화된 합성 계획을 가능하게 합니다. 요약하자면, 본 논문에서 제시된 결과는 연구자의 직관을 ML 모델에 적용함으로써 유기 화학 반응 예측 분야에서의 장점을 강조합니다. 이러한 연구 결과는 분야의 발전에 기여하는 데 그치지 않고 합성 계획 및 관련 분야에서 화학자의 직관적 설계 원칙을 활용한 추가적인 개선을 위한 미래 연구의 방향을 제시합니다.