第八种可变剪切
可变剪切(Alternative Splicing,AS)是指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA剪接异构体的过程。可变剪接在转录组的形成中起着至关重要的作用,并且该过程在癌症中经常发生改变。
常规的可变剪接大致可分为7种基本形式:
(1)可变受体位点(AA);(2)可变供体位点(AD);(3)可变启动子(AP);(4)可变终止子(AT);(5)内含子保留(RI);(6)外显子跳跃(ES);(7)外显子保留(ME)[1]。
最近有研究者发现一种非常规的可变剪接形式 :Exitron splicing (EIS) [外内含子剪接]。EIS在蛋白质编码的外显子中创建一个隐性内含子(称为exitron),以增加蛋白质组的多样性。exitron是隐性内含子,在一个被注释的外显子内有两个剪接位点;也就是说,exitron是一个外显子的内部区域,同时具有蛋白质编码(外显子)和剪接(内含子)的潜力,有证据表明EIS在癌症中发挥着重要作用。尽管在癌症中可能有很大的影响,但exitron剪接在癌症基因中的功能及其临床相关性仍然未知。
今天解读一下2021年三月份发表在《Molecular cell》(IF=19.328)上的一篇文章。该研究系统地检测和描述了33种癌症类型中的外内含子剪接事件。研究表明外内含子剪接代表了除基因改变之外的另一种癌症驱动机制,并且外内含子剪接衍生的新抗原负担是预测癌症免疫疗法反应的一个候选因素[2]。
文章摘要:
作者对来自9,599个肿瘤转录组的33种癌症的EIS进行系统分析,发现EIS影响了63%的人类编码基因,其中95%的事件是肿瘤特有的。研究发现EIS和其受影响基因的体细胞突变之间的相互排斥模式。在功能上,文章发现EIS改变了已知的和新的癌症驱动基因,导致功能的获得或丧失,从而促进肿瘤的发展。此外,EIS衍生的新表位与MHC I类或II类结合。对一个肾透明细胞癌队列的临床数据分析显示,EIS衍生的新抗原负荷与检查点抑制剂反应之间存在关联。
主要结果:
Exitron splicing事件在癌症中的全局图谱
作者从TCGA数据库中收集了33种癌症类型的9,599名患者的RNA-Seq数据,以及670个匹配的正常样本(图1A)。研究者还开发了一个生物信息学工具,ScanExitron,用于分析RNA-seq数据中的外内含子检测。ScanExitron根据剪接接头和基因注释来识别exitron,并通过一个剪接百分比(percent spliced out ,PSO)指标来过滤出低可信度的候选者,该指标衡量了特定exitron被剪接的转录本的百分比(图1B)。
由于TCGA中的正常组织与肿瘤相邻,而且只适用于一部分癌症类型,作者扩大了数据来源,包括GTEx(v7)RNA-Seq数据,来自9,636个健康组织样本,代表30个解剖部位的53种组织类型(图1A)。在所有的肿瘤样本中,作者观察到卵巢癌(OV)、食道癌(ESCA)、胃癌(STAD)和急性骨髓性白血病(LAML)比其他癌症类型具有更高的外内含子剪接负担(图2A)。在八种癌症类型的荟萃分析中,作者观察到肿瘤样本的exitron剪接负荷明显高于匹配的正常样本(图2B)。这些发现表明,exitron剪接可能有助于癌症表型的形成。之后,作者确定了16个exitron splicing事件,这些事件在多种癌症中显示出反复的失调(图2C)。受这些不同剪接的exitron影响的基因显著地富集在由COSMIC癌症基因上。例如,肿瘤抑制基因FOXO4和SPEN都是由于发生了exitron splicing事件而改变了基因的转录抑制功能(图2D)。
肿瘤特异性exitrons能识别新的癌症驱动基因
作者识别了主要在肿瘤样本中剪接的exitrons,称之为肿瘤特定exitrons(tumor-specific exitrons,TSE)。 研究者对正常样本(TCGA正常样本和GTEx)与TCGA肿瘤数据进行比较,以确定TSEs:1)在GTEx样本中没有剪接,2)在不超过三个TCGA正常样本中剪接。 结果,共有123,338个(95.3%) exitrons被认定为TSE。 同时作者发现,与其他癌症相比,OV、ESCA、STAD和LAML的TSE剪接事件的数量最高(图3A)。作者实施了一种基于频率的方法,以确定在每个肿瘤类型中富含TSE剪接事件的基因,称为显著外内含子剪切基因(significantly exitron-spliced genes,SEGs)。根据其剪接频率对SEGs进行排序,发现排名前35位的SEGs显著富集于COSMIC癌症基因普查中的基因(图3B)。FET蛋白家族的成员TAF15,FUS和EWSR1在排名靠前的SEG中。并且这三个基因在肿瘤样本中的外内含子剪接是相互排斥的,意味着这些外内含子剪接事件可能有类似的功能影响(图3C)。 此外,在FET蛋白中出现TSE改变的患者与无进展生存期受损有关(图3D),这表明FET家族基因中的外内含子剪接可能在促进癌症进展中发挥作用。
作者对SEGs进行了组织特异性分析。 发现NEFH是前列腺癌的一个SEG(图3B)。因此,作者在TCGA前列腺腺癌(PRAD)队列中检查了NEFH的表达。NEFH在正常样本中的表达水平明显高于前列腺肿瘤样本。NEFH的表达与Gleason评分成反比,Gleason评分是一个从肿瘤组织学预测癌症侵略性的评分系统(图3E)。作者进一步评估了NEFH在150个肿瘤和29个正常样本中的表达,这些样本来自MSKCC前列腺癌肿瘤基因组项目,该项目收集了基于阵列的基因表达数据和综合临床信息。作者发现与局部的前列腺肿瘤和正常组织相比,NEFH在转移性前列腺癌中明显下调(图3F)。 此外,肿瘤中NEFH的低表达与生化复发的高风险有关(图3G)。为了支持这一点,作者用两个NEFH-阴性的前列腺癌细胞系C4-2和PC-3(图3H)来验证NEFH的功能。 当比较过量表达NEFH的前列腺癌细胞与对照组细胞时,观察到NEFH的异位表达抑制了细胞生长(图3I)、集落形成(图3J)和DNA复制(图3K),但通过裂解PARP蛋白水平测量,促进细胞凋亡(图3H),证实了NEFH在前列腺癌中具有肿瘤抑制功能。
肿瘤特异性exitrons和体细胞突变之间的互斥性
显著突变的基因(SMGs),如TP53、PIK3CA和KRAS,以及SEGs,如TAF15、RRBP1和NEFH被分成两组(图4A),这表明 SMGs和SEGs是相互排斥的。研究者把重点放在PRAD队列上,发现NEFH是排名最高的SEG,但没有显示突变(图4B)。值得注意的是,当关注PRAD队列中显示体细胞突变和外内含子剪接的基因时,突变和外内含子剪接之间的相互排斥模式在疾病样本层面上是明显的(图4B)。在研究外内含子剪接对蛋白质功能的影响时,发现外内含子聚集在叉头DNA结合域(FKHD)(图4C)。将突变和外内含子映射到FKHD的三维晶体结构中,发现外内含子剪接的改变很大程度上影响了non-Wing 2区域(图4D)。当检查所有的TSE TCGA肿瘤时,作者发现有明显的重叠,并且在受外内含子剪接和体细胞突变影响的蛋白家族(Pfam)领域有强烈的相关性(图4E),表明外内含子剪接影响蛋白功能的方式与基因改变类似。
作者将基于单基因的SEG分析到基于多基因的分析,以测试TSE剪接事件是否在主要生物过程的基因组中显著富集。利用MSigDB对特定肿瘤类型中的每个基因组进行了基于多基因的分析。确定了20个基因组在不同的肿瘤类型中因TSE剪接而发生明显改变(图5)。
肿瘤特异性exitrons是新表位的来源之一
为了研究TSE slicing是否有可能产生免疫原性的新抗原。作者应用ScanNeo来预测TCGA肿瘤中潜在的TSE新抗原。 对于总共123,338个独特的TSE剪接事件,作者确定了168,206个推测的新抗原,每个TSE剪接事件平均有1.4个新抗原。在所有的肿瘤类型中,发现OV的TSE新抗原的负担最高。作者使用MS-GF+搜索了32个OV和35个乳腺浸润癌(BRCA)样本的质谱(MS)数据,这些样本来自临床蛋白质组学肿瘤分析联盟(CPTAC)项目。发现28个来自TSE拼接的新表位。 与nsSNVs和indels相比,TSE拼接在OV中每个样本引入的CPTAC确认的新抗原数量较多,但在BRCA中数量较少(图6A),这可能反映了两种癌症类型之间TSE拼接和突变引起的新抗原负担的差异。基于MS的免疫肽组分析证实了预测的新表位MKANPALTMVSSSPTRL(图6B)。接下来,作者计算了TSE新抗原负荷与TCGA肿瘤免疫细胞组分之间的相关性,以评估TSE新抗原负荷与免疫应答之间的相关性。发现在多种癌症类型中,TSE新抗原负荷与较高的CD8+ T细胞、M1巨噬细胞和CD4+记忆T细胞含量呈正相关(图6C)。作者还发现在ccRCC中TSE新抗原负荷与ICB临床获益之间存在显著相关性 (图6 D)。作者还观察到OV和肾透明细胞癌(KIRC)是两种最高的癌症类型,TSE新抗原载量高的患者表达的这些免疫原性基因标记物水平较高(图6E)。研究表明,具有高TSE新抗原负荷的卵巢肿瘤可能受益于ICB治疗。
总结:
这项工作通过大规模的转录组分析构建了一个癌症exitron剪接景观。研究主要发现外内含子剪接破坏了功能性蛋白质结构域,从而导致癌症驱动效应。通过免疫肽组分析确定了外内含子剪接衍生的新抗原。外内含子剪接的新抗原负荷预测对检查点抑制剂治疗有更好的反应。相较于传统的七种可变剪接方式,外内含子剪接作为第八种剪接方式对于新抗原的预测和研究提供了新的思路。此外,泛癌中的外内含子剪切研究思路同样适用于单一癌型的研究,例如最近发表的名为“Landscape of exitrons in gastric cancer”的文章[3]。这篇文章刻画了胃癌中exitrons的特征。包括exitrons的互斥性可以协同致癌,剪切调控网络中剪切因子靶向了异常的外内含子剪切,外内含子来源的新抗原肽在胃癌中表达。这一系列文章足以证明exitrons在癌症中有很大的研究空间。
参考文章:
[1] Zong Z, Li H, Yi C, Ying H, Zhu Z, Wang H. Genome-Wide Profiling of Prognostic Alternative Splicing Signature in Colorectal Cancer. Front Oncol. 2018 Nov 20;8:537. doi: 10.3389/fonc.2018.00537. PMID: 30524964; PMCID: PMC6262947.
[2] Wang TY, Liu Q, Ren Y, Alam SK, Wang L, Zhu Z, Hoeppner LH, Dehm SM, Cao Q, Yang R. A pan-cancer transcriptome analysis of exitron splicing identifies novel cancer driver genes and neoepitopes. Mol Cell. 2021 May 20;81(10):2246-2260.e12. doi: 10.1016/j.molcel.2021.03.028. Epub 2021 Apr 15. PMID: 33861991; PMCID: PMC8141048.
[3] Zhang Y, Ye G, Yang Q, Zheng B, Zhang G, Hu Y, Yu J, Li G. Landscape of exitrons in gastric cancer. EBioMedicine. 2022 Sep 19;84:104272. doi: 10.1016/j.ebiom.2022.104272. Epub ahead of print. PMID: 36137412; PMCID: PMC9494173