Cancer research has been actively conducted for centuries, and many progress has been made to increase the cancer survival rate. However, cancer genome exhibits extensive heterogeneity which poses a fundamental problem in understanding cancer biology. Therefore, I have attempted to identify the role of non-coding mutations and to discover the essential genes for novel therapeutic approach through network-based analysis.
Cancer driving genes have been identified as recurrently affected by variants that alter protein-coding sequences. However, a majority of cancer variants arise in noncoding regions, and some of them are thought to play a critical role through transcriptional perturbation. Here I identified putative transcriptional driver genes based on combinatorial variant recurrence in cis-regulatory regions. The identified genes showed high connectivity in the cancer type-specific transcription regulatory network, with high outdegree and many downstream genes, highlighting their causative role during tumorigenesis. In the protein interactome, the identified transcriptional drivers were not as highly connected as coding driver genes but appeared to form a network module centered on the coding drivers. The coding and regulatory variants associated via these interactions between the coding and transcriptional drivers showed exclusive and complementary occurrence patterns across tumor samples. Transcriptional cancer drivers may act through an extensive perturbation of the regulatory network and by altering protein network modules through interactions with coding driver genes.
Systematic in vitro loss-of-function screens provide valuable resources that facilitate the understanding of cancer vulnerabilities. Here, I developed deep learning-based methods to predict tumour-specific vulnerabilities in patient samples by leveraging a wealth of cell line screening data. Acquired dependencies of tumours were inferred in cases in which one allele was disrupted by inactivating mutations or in association with oncogenic mutations. Nucleocytoplasmic transport by Ran GTPase was identified as a common vulnerability in triple-negative or Her2-positive breast cancers. Vulnerability to loss of Ku70/80 was predicted for tumours that are defective in homologous recombination and rely on nonhomologous end joining for DNA repair. my experimental validation for Ran, Ku70/80, and a proteasome subunit using patient-derived cells showed that they can be targeted specifically in particular tumours that are predicted to be dependent on them. This approach can be applied to facilitate the discovery of novel therapeutic targets for different types of cancers.
지난 수 세기 동안 암 연구가 활발히 진행되어 왔으며, 많은 진전을 이루어 암 생존율이 증가하였다. 그러나 암은 복잡한 질병으로 환자마다 다른 돌연변이를 갖기 때문에 암 발생의 원인에 대해서 정확히 규명하기 어렵다. 이에 따라 본인은 네트워크 기반의 암 돌연변이 분석을 통해 생물학적 의의를 발견하고자 하였으며 효과적인 치료를 위해 암 필수 유전자에 대한 연구를 진행하였다.
암 유발 유전자는 단백질 코딩 서열을 변경시키는 돌연변이에 의해 영향을 받는 것으로 여러 환자에서 반복적으로 나타나는 것이 밝혀졌다. 그러나 대부분 암의 돌연변이는 비 전사 영역에서 발생하며, 일부는 전사 변화를 야기하여 암 발생에 중요한 역할을 한다고 여겨진다. 본인은 전사조절지역에서 반복적으로 발견된 돌연변이를 근거로 새로운 암 유전자를 추정하였다. 확인 된 유전자는 암 전사 조절 네트워크상에서 유전자들과 높은 연결성을 보이며, 많은 하위 유전자를 조절하여 주변으로 영향을 끼치는데 이는 암 발생에 원인이 되는 역할을 한다고 볼 수 있다. 단백질 간의 상호 작용에서는 기존 암 유전자만큼이나 서로 밀접하게 연결되지 않았지만 암 유전자를 중심으로 네트워크 모듈을 형성하였다. 이러한 상호 작용을 통해 기존의 암 유전자와 새롭게 발견된 전사 암 유전자가 종양 샘플 전반에 걸쳐 서로 배타적이며 상호보완적으로 발생하는 현상을 발견했다. 위와 같은 분석을 통해 전사 암 유전자는 조절 네트워크의 광범위한 변화와 암 유전자와의 상호 작용을 통해 단백질 네트워크 모듈을 변경함으로써 암 발생에 중요한 역할을 한다.
유전체 수준의 필수 유전자 분석은 암 취약성에 대한 이해를 돕는 귀중한 데이터를 제공한다. 본인은 다양한 세포주의 필수 유전자 데이터를 활용하여 환자 표본의 종양 특이적 취약성을 예측하는 심층 학습 기반의 모델을 개발했다. 한 개의 대립 유전자가 불활성 돌연변이나 종양 형성 돌연변이가 생긴 표본들로부터 종양의 필수 유전자(의존성)가 생기는 것을 발견하였다. 예시로, 핵 세포질 수송을 담당하는 Ran GTPase의 경우 triple-negative 또는 Her2 양성 유방암에서 공통적으로 취약성이 발견되었다. 또한 Ku70/80 유전자의 기능 상실에 의한 취약성이 예측된 종양 표본에서는 상동 재조합이 결함이 생겨 비균질성 종단 접합에 의존한 DNA repair를 보임을 발견하였다. 환자 유래 세포를 이용한 Ran, Ku70/80 및 단백질분해효소 subunit에 대한 실험적 검증 결과, 이들에 의존성이 예측되는 특정 종양을 특이적으로 표적화 할 수 있음을 보여주었다. 이 접근법은 다양한 유형의 암에 대한 새로운 치료 표적의 연구에 적용될 수 있다.