Most human genes can produce multiple transcript isoforms through the usage of alternative promoters and splice sites, which greatly expand the phenotypic complexity. Recent analyses of thousands of tumor RNA sequencing data revealed that aberrant splicing and alternative promoter activation are widespread in cancer, suggesting the pivotal role of isoform dysregulation in carcinogenesis. Here, by integrating RNA sequencing data from TCGA, PCAWG, and GTEx projects, we reconstruct the sequence of individual transcripts expressed in >26000 cancer and normal samples and provide a comprehensive landscape of alternative isoform usage across 39 tissues and 38 cancer types. Our isoform-centric analysis reveals that global transcriptome architecture is highly distinct across tissues, between cancer and normal samples of the same tissue origin, and between molecular subtypes of cancer even at a sub-gene resolution; alternative promoter usage and splicing together contribute to ~40% of the transcriptome heterogeneity across tissues and ~50-60% within tissues and cancer types; cancer often increases the usage of aberrant tumor suppressor gene isoforms that have lost the protein-coding potential; and aberrant splicing events occasionally co-occur in a single RNA molecule in a way that offsets the frame-shifting effect of each other and rescues the function of important oncogenes in tumors. Our findings suggest that cancer often dysregulates the usage of alternative isoforms to perturb key oncogenic pathways, highlighting the importance of transcriptome profiling at the transcript resolution to improve individualized diagnostic and therapeutic strategy for cancer patients.
대부분의 인간 유전자는 대체 프로모터 및 스플라이스 부위의 사용을 통해 여러 동형 전사체를 생성할 수 있으며, 이는 인간 표현형의 복잡성을 크게 확장한다. 수천 개의 종양 RNA 염기서열 데이터에 대한 최근 분석에 따르면 비정상적인 스플라이싱 및 대체 프로모터 활성화가 암에 널리 퍼져 있으며, 이는 암 발생에 있어 동형 전사체의 중추적 역할을 시사한다. 우리는 TCGA, PCAWG 및 GTEx 프로젝트의 RNA 염기서열 데이터를 통합하여 26000 개 이상의 암 및 정상 조직에서 발현되는 개별 전사체의 서열을 재구성하고 39 개 조직 및 38 개 암 유형에 걸쳐 동형 전사체의 발현 양상을 규명하고자 하였다. 우리의 동형 전사체 중심 분석은 전체 전사체 구조가 조직 간에, 암과 동일한 조직 기원의 정상 샘플 간에, 그리고 동일한 암종의 분자유전학적 아형 간에 매우 뚜렷하게 다르다는 사실을 보여주었다. 대체 프로모터 사용 및 스플라이싱은 조직 전반에 걸쳐 전사체 이질성의 ~40%를 형성하며, 각각의 조직 및 암 유형 내에서는 ~50-60%의 전사체 이질성에 기여하는 것으로 추정되었다. 암은 종종 단백질 코딩 잠재력을 상실한 비정상적인 종양억제유전자 동형체의 사용을 증가시키며, 이는 동형체의 비정상적 조절이 발암 기전에 중요하게 작용할 수 있음을 시사한다. 우리는 또한 비정상적인 여러 개의 스플라이싱이 단일 RNA에서 발생할 경우 서로의 효과를 상쇄함으로써 코딩 프레임을 복원하는 경우들을 발견하였는데, 특히 일부 암에서 이 기전을 통해 중요한 종양유전자의 기능을 복원할 수 있음을 확인하였다. 우리의 연구 결과는 암이 종종 암 관련 신호전달경로를 교란시키기 위해 비정상적인 동형 전사체 사용을 상향 조절할 수 있음을 보여주었고, 암 환자를 위한 개인화된 진단 및 치료 전략을 개선하기 위해 동형 전사체 수준에서의 암 연구가 필수적임을 시사한다.