Cancer is one of the leading causes of human death, requiring novel therapeutics for the treatment. Despite continuous efforts to conquer cancer, many clinical trials still fail due to efficacy and side effect issues. To reduce the time and costs of the development of anti-cancer drugs, we developed two approaches to the data-driven identification and validation of therapeutic targets for cancer. We introduced intercellular CRISPR screen, which combines two genome-wide CRISPR screen datasets, each in cancer and immune cells, to identify regulators of immune cell function. Our results showed that intercellular CRISPR screens can identify well-known modulators of cytotoxic T cells and suggested seven novel intercellular interactions as the potential targets of immunotherapy. To validate targets for targeted therapy, we developed GESIGAN, a generative adversarial network model for predicting context-specific gene expression signatures upon gene knockouts. We used the predicted gene expression signatures for the validation of cancer therapeutic targets via reversal of cancer gene expression signatures. We envision that data-driven approaches to drug discovery will help to reduce the time and cost required for the development of novel cancer therapeutics.
암은 인류 사망의 가장 큰 원인으로 알려져 있다. 암 치료제를 개발하기 위한 지속적인 연구에도 불구하고, 많은 항암 치료제들이 효과와 안전성 문제로 인해 임상 시험에서 실패한다. 이로 인한 시간과 비용을 절감하기 위해서는 신약 개발 초기 단계에 약물의 타겟을 효과적으로 발굴하고 검증하는 것이 필수적이다. 본 연구에서는 데이터를 기반으로 항암제의 타겟을 발굴하고 검증하는 방법을 제안하였다. 면역항암제의 타겟을 발굴하기 위하여 전장유전체 수준의 크리스퍼-카스9 데이터를 분석하여 세포독성 T세포의 기능을 조절하는 세포간 상호작용을 발굴하였다. 제안한 방법론은 기존에 알려진 세포독성 T세포 기능 조절자들을 발굴하는 데에 효과적이었으며, 새로운 세포간 상호작용 7쌍을 제안하였다. 또한, 표적항암제의 타겟을 발굴하기 위해서 유전자 녹아웃 상황에서의 차등 유전자 발현량을 예측하는 인공지능 모델을 개발하였다. 이를 항암제 타겟의 효능을 검증하는 데에 활용한 결과, 예측된 차등 유전자 발현량이 실험으로 측정된 것과 비슷한 성능을 보이는 것을 확인하였다. 데이터와 인공 지능을 신약 개발 분야에 활용함으로써 신약 개발의 기간을 단축하고, 비용을 절감할 것으로 기대된다.