一文告诉你“可变剪接”怎么发10分+
可变剪接(Alternative splicing, AS)在基因调控过程中起着重要作用,在癌症中很常见。RNA结合蛋白(RNA binding protein, RBP)是AS的分子决定因素之一,并且,RBP-基因网络活性的扰动可能在一定程度上促进癌症的发展。近年来关于可变剪接的文章层出不穷,今天分享一篇2021年6月发表在Molecular Therapy-Nucleic Acids(IF: 10.183)的文章。这篇文章综合AS扰动景观分析识别了RBPs在癌症中的潜在治疗靶点,并为RBPs在癌症中的调节功能提供了新的见解。感兴趣就一起往下看看吧!
可变剪接(AS)在基因表达的转录后调控中起着关键作用。AS的扰动已经在各种类型的癌症中被发现,并且已经证明AS可能会激活各种癌症信号通路。此外,AS事件在癌症组织中的临床意义已被证明。尽管几个候选基因中的AS事件已被确定为有助于癌症的发展,但在整个转录组范围内的癌症特定或复发性剪接模式却较少被研究。识别这些扰乱AS的分子调控对开发癌症生物标志物和治疗靶点至关重要。
随着计算和实验技术的发展,癌症中AS事件的遗传和表观遗传决定因素已被发现。AS的失调可能受到体细胞突变、反义RNA、RNA结合蛋白(RBPs)、转录因子(TFs)和表观遗传因子的调控。最近的研究还发现,可能调节AS事件的体细胞突变在RBPs中富集。RBPs在癌症的发生和发展中起着不可缺少的作用。越来越多的RBPs被确定为各种类型癌症中AS事件的调节器。例如,RBP RALY促进了乳腺癌中精氨酸甲基转移酶1的交替剪接异构体V2的表达和转移潜力。RBP ZMAT3是抑制结直肠癌中CD44剪接的调节因子。研究还发现,EIF2S2敲除联合奥沙利铂治疗可能是一种潜在的癌症联合治疗方法。
本文系统地分析了不同癌症类型的全基因组替代剪接扰动。作者还提出了一个计算管道,以确定AS扰动的RBP调节器,并发现这些RBP调节器在癌症标志相关途径中发挥重要作用。此外,研究人员根据RBP调节器的表达确定了不同的亚型,这些亚型的患者表现出不同的生存和通路活性。文章最后还确定了药物与RBP的相关性,这为癌症治疗提供了新的潜在药物。
癌症中受干扰的AS事件的景观
为了确定AS在不同癌症类型中的全面失调,作者系统地分析了TCGA队列中18种人类癌症的mRNA剪接谱(图1A)。总共有7245个癌症样本和735个正常样本。在所有的癌症类型中,发现了大量的剪接事件,而且不同的癌症类型之间剪接类型的比例没有太大差异(图1B)。分析中总共考虑了七种类型的AS事件,包括外显子跳跃(ES),替代供体位点(AD),替代接受体位点(AA),保留内含子(RI),互斥外显子(ME),替代终止子(AT),以及替代启动子(AP)。最常见的剪接事件是ES,占整个癌症总事件的34.5%-41.4%(图1B)。相比之下,最不常见的AS事件是ME,它只占整个癌症类型总事件的0.3%-0.6%。接下来作者确定了每种癌症类型中的扰动AS事件(perturbed AS events, PASEs)。研究发现在癌症中AS事件被扰乱的比例很高,不同癌症类型的PASEs数量不同(图1C,顶部)。作者将具有较高剪接百分比(PSI)值的AS事件定义为癌症中的上调AS事件,而具有较低PSI值的AS事件被指定为下调AS事件。在KIRC和胃腺癌(STAD;图1C)中发现了更多上调的AS事件。在乳腺浸润癌(BRCA)、多形性胶质母细胞瘤(GBM)和甲状腺癌(THCA;图1C)中有更多下调的AS事件。作者还探讨了不同AS类型在癌症中被扰乱的程度。计算了每种类型的AS事件的概率(OR)。虽然ES事件被扰乱的数量较多,但PASEs可能在AP和AT类型中富集(图1C;底部)。此外,癌症中上调的PASEs在不同的癌症中也富集于RI剪接类型(图1C;底部)。这与最近观察到的RI是癌症干性和侵袭性的标志是一致的。这些结果表明,在不同的癌症类型中普遍存在AS的改变。
PASEs提示肿瘤的组织起源
具有相似组织起源的癌症类型往往具有一些共同的分子特征,如基因表达和DNA甲基化。作者接下来调查了具有相似组织起源的癌症类型是否表现出相似的PASEs。首先用t分布的随机邻接嵌入(t-SNE)将整个癌症队列的AS多样性可视化。这突出了AS事件的组织特异性和癌症类型的差异和共性(图2A)。文章发现了起源相似且经常被描述为具有类似分子特征的癌症类型,如肾脏肾乳头状细胞癌(KIRP)、KIRC和肾脏嗜铬细胞(KICH),肝脏肝细胞癌(LIHC)和胆管癌(CHOL),或结肠腺癌(COAD)和直肠腺癌(READ),通常被紧密地聚在一起(图2A)。此外,作者还计算了两个癌症之间的相似性,即两个癌症中的PASEs的Jaccard指数。根据以共享PASEs的比例计算的相似性聚类,观察到了类似的模式(图2B)。这些结果与以前专注于表达和甲基化分析的研究一致,并表明相关的AS机制可能在具有类似组织来源的癌症类型中运作。接下来,作者调查了PASEs对癌症特异性的贡献程度。尽管大量的PASEs显示出癌症的特异性,但一些PASEs参与了许多癌症类型(图2C)。作者将这些AS事件定义为泛癌症AS事件。这些泛癌差异性AS事件涉及到一些著名的致癌基因(如NFE2L2、RARA和SGK1)、肿瘤抑制基因(如CASP8、DNMT3A、FANCD2和SMARCA4)以及融合基因。这些泛PASEs中的大多数都与患者的生存期有关,它们在各种癌症类型中的表现相似。作者接下来对这些泛癌基因进行了功能富集分析。泛癌PASE参与的基因在一些癌症相关的功能类别中富集(图2D),如翻译启动,蛋白质结合,以及参与细胞-细胞粘附。此外,这些基因在睾丸、K562和结直肠腺癌中表现出组织特异性高表达(图2D)。综上所述,这些结果意味着剪接异常通过调节癌症相关的途径影响癌症生物学。
扰动AS事件与疾病严重程度相关
为了确定与癌症中受干扰的PASEs相关的分子参与者,作者设计了一个工作流程来识别RBP调节因子(图3A)。首先将PSI与正常样本进行比较,构建了每例患者的AS活动扰动谱。基于同一患者各AS事件的扰动水平,计算出两个活动评分(激活活动[SA]和抑制活动[SR])。其次,作者通过计算RBP的表达与AS活动评分的Spearman相关系数,确定了在癌症中表现出转录组干扰的RBP。
作者手工收集了2038个RBPs,并进一步将它们分为九个群组(图3B)。其中有139个核糖体蛋白,636个mRNAs和89个非编码RNAs(ncRNAs)。接下来作者探讨了RBP表达和AS扰动分数之间的相关性。AS扰动分数(SA或SR)较高的患者也可能表现出较高的疾病严重性(图3C)。作者还比较了不同AS扰动分数的患者的生存率。结果发现在各种癌症类型中,SA较高或SR较高的患者可能表现出较差的生存率。特别是KIRC和LIHC中SA或SR较高的患者,其生存期明显较差(图3D)。通过整合年龄、性别和肿瘤阶段进行了多变量分析。我们发现,在KIRC和LIHC中,AS扰动的水平是一个独立的风险因素。这些结果共同表明,AS扰动与疾病的严重程度有关,其中普遍存在的PASEs的癌症患者表现出更差的生存。
AS相关RBP调节因子的识别
AS活性评分的紊乱与疾病的严重程度有关,作者假设其表达水平与这些评分相关的RBPs很可能在癌症中调节AS。首先,作者确定了18种癌症类型中差异表达的RBPs。分析发现更多的RBPs在癌症中被上调(图4A),作者还计算了这些RBPs差异表达的癌症类型的数量。发现更多的RBPs只在一种癌症类型中观察到(图4B),这表明不同的癌症类型有不同的RBP失调特征。此外,在分析的18种癌症类型中,有一些持续失调的RBPs。作者确定了246个RBPs在超过15种癌症类型中持续上调或下调。在这些RBPs中,APOBEC3B、DCN、EZH2和RAD51AP1在所有18种癌症类型中都有差异表达。APOBEC3B在癌症中起着关键作用,并被报道在许多癌症中被上调。作为染色质调控的主调控者,EZH2在人类上皮癌中被过度表达。大多数RBPs表现出持续的差异性表达。所有这些RBPs为确定癌症的关键治疗目标提供了宝贵的资源。
作者接下来根据RBP表达和AS活性评分之间的相关性,确定了不同癌症类型的AS事件的潜在RBP调节器。在18种癌症中,总共确定了1365个与活性评分相关的RBPs(ActRBPs)和1045个与抑制评分相关的RBPs(ResRBPs)。在15种或更多的癌症类型中观察到211个ActRBPs和91个ResRBPs(图4C和4D)。此外,MEX3A、MRVI1、PUS7、FHL1和SYNE1被确定为顶级ResRBPs,它们与18种癌症类型的AS活性相关。MEX3A是一个干性相关的基因,在细胞增殖中发挥重要作用,而FHL1在癌症中发挥肿瘤抑制基因的功能,并被表观遗传信号所抑制。
泛癌RBP调节因子的功能
接下来,作者计算了每个RBP调节因子的癌症类型数量,将RBP调节因子分为三种类型。仅发生于一种癌症类型的RBPs被定义为癌症特异性RBPs,在2-11种癌症类型中发现的RBPs被定义为中度RBPs,在>11种癌症中发现的RBPs被定义为泛癌症RBPs(图5A)。我们总共分别确定了302个和345个癌症特异性ActRBPs和ResRBPs。泛癌ActRBPs和ResRBPs分别有71个和22个。这些泛癌症RBPs可能调节不同癌症类型的各种AS事件(图5B)。特别是,ActRBP NME1和ResRBP SYNE1可能在癌症中调节最多的AS事件。NME1是一种转移抑制因子,可以在不影响原发肿瘤大小的情况下潜在地减少转移。结果表明,NME1可能调节许多癌症相关基因的AS,如CD44、CTNND、和PTBP2。这些结果表明,识别潜在的AS靶点提供了对RBP调节因子功能的见解。
为了研究这些泛癌RBPs的功能,作者接下来根据其调节的AS事件相关基因进行功能富集分析。作者专注于50个癌症标志相关的通路。在错误发现率(FDR)<0.01时,在93个RBPs和16个通路中发现了442个RBP-通路关联(图5C)。结果发现,所有的泛癌RBPs都可能调节至少一个癌症标志相关通路。此外,有更多的RBPs参与有丝分裂纺锤体、紫外线反应、磷脂酰肌醇3-激酶(PI3K)-AKT-哺乳动物雷帕霉素(mTOR)靶向信号和脂肪生成。此外,作者发现RBPs在几个与新陈代谢相关的通路中发挥了重要作用(图5C)。事实上,越来越多的证据表明它们在新陈代谢中的作用。所有这些结果表明,泛癌RBPs通过调节AS事件在癌症中发挥基本作用。
基于RBP的肾癌患者分层
越来越多的研究表明,AS事件能够区分不同的癌症亚型,而且对预后有影响。作者还发现,AS活动与疾病的严重程度有关,特别是在肾癌中。因此,作者接下来确定了RBP调节器,并调查了它们是否有助于癌症的分子亚型划分。作者重点关注两种类型的肾癌(KIRC和KIRP)。文章从这两种癌症类型中确定了68个共同的RBP调节器(图6A)。接下来,根据这些RBPs的表达,将肾癌患者分成不同的亚型。进行了一致性聚类,K值从2到10。这项分析显示肾癌有四个亚型(图6B)。C1、C2、C3和C4亚型中分别有298、76、426和26名患者。调查这些患者的来源,发现C1、C2和C4的大多数患者是KIRC。然而,C3亚型同时包括KIRC和KIRP患者。此外,作者还探讨了不同亚型患者的临床信息。发现C4型的患者被诊断的年龄明显较小(图6C)。在所有亚型中,C2亚型患者的年龄最高。作者还计算了高分期(iii和iv)和低分期(i和ii)患者的比例。C2和C4的高分期患者多于C1和C3(图6D)。这些结果表明,C4的病人可能更严重,所以作者进一步调查了他们的生存率。发现C4的病人生存率最差(图6E)。此外,C1的病人比C3的病人有更好的生存率。C2的患者也比C4的患者有更好的生存率。这些结果表明,常见的RBP调节器有助于识别癌症的分子亚型。
肾癌亚型的不同癌症通路
作者接下来调查了不同肾癌亚型的通路活动的差异程度。首先,GSVA分析计算了所有患者的50条癌症标志相关的通路活性。接下来,通过方差分析(ANOVA)比较通路活性的差异。结果发现,这些通路中的80%(40/50)在C1-C4亚型中表现出不同的通路活性(图7A)。特别是,C2和C4患者的通路活性明显高于C1和C3亚型的患者(图7B)。这些结果与C2和C4亚型患者的生存率较差是一致的。虽然C1和C3的患者之间,以及C2和C4的患者之间通路活性相似,但这几组之间存在明显的生存差异(图6E)。作者还发现,胆汁酸代谢途径在C1和C2亚型中显示出更大的活性(图7C),这可能是区分C1与C3、C2与C4亚型的潜在通路指标。胆汁酸在调节葡萄糖、脂质和能量代谢方面起着关键作用。此外,作者还调查了患者的免疫细胞浸润水平。C1患者显示出较高的免疫细胞浸润水平。作者还探讨了不同亚型中患者的突变情况。总共发现有五个基因在亚型中具有明显的突变频率。这些基因已被发现在癌症中发挥关键作用,如VHL52和PBRM153。根据RBPs调控的AS事件,作者又将患者分为三个亚型。结果发现,这些集群与基于RBP表达的分类明显重叠。接下来,作者在另两个独立的数据集中验证了该分类。综上所述,癌症亚型之间的通路活动存在着明显的差异,这为基于通路的癌症治疗提供了潜在的候选方案。
肿瘤中RBP的治疗靶点
失调的RBPs可以影响癌症的许多特征,这表明RBPs可能是癌症治疗的一个很好的治疗靶点。接下来,为了确定癌症治疗的潜在RBP候选者,作者评估了不同癌症类型的RBPs表达水平和药物活性之间的相关性。结果发现,在10种癌症中,有1,088个RBPs与药物半数最大抑制浓度(IC50)值相关(图8A)。作者关注KIRC中药物-RBP的相关性,这些相关的RBP和药物形成了一个密集的网络(图8B)。具体来说,作者发现几种药物,如培利替尼、马西替尼和奥米帕利西布,与更多的RBPs相关。佩利替尼是一种有效的不可逆的表皮生长因子受体酪氨酸激酶抑制剂,目前正在进行治疗癌症的临床试验。此外,一些RBPs,如ATP5F1、BCAS2和RRP12,也与更多的药物相关。这些RBPs已被证明在各种类型的癌症中发挥关键作用。此外,作者提取了68个用于肾癌分型的RBP的子网络。10种药物可能与5种RBP的表达相关(图8C),包括SNRPD1、RNPS1、PPIA、MRPL14和PPIH。PPIH的表达与masitinib和QL-XII-47相关。接下来,作者通过将细胞系分为两组来计算模拟RBP表达的改变。然后比较了RBP表达不同的两组之间的IC50值,发现了显著的组间差异。这些结果表明,RBP表达的改变可能影响细胞系的IC50。此外,PPIH高表达与较差的肾癌总生存率和无病生存率显著相关(图8 D)。这些结果提示这两种药物有可能用于癌症治疗。
总之,本文对AS扰动景观的综合分析确定了RBPs为癌症的潜在治疗目标。作者提出了一种识别RBP调节因子的计算流程。通过泛癌症分析发现了一些保守的RBP调节因子。分析表明RBP调节因子的表达有助于癌症亚型的分型,并为RBPs在癌症中的调节功能提供了新的见解。
Li J, Pan T, Chen L, Wang Q, Chang Z, Zhou W, Li X, Xu G, Li X, Li Y, Zhang Y. Alternative splicing perturbation landscape identifies RNA binding proteins as potential therapeutic targets in cancer. Mol Ther Nucleic Acids. 2021 Apr 9;24:792-806. doi: 10.1016/j.omtn.2021.04.005 . PMID: 33996260; PMCID: PMC8099609.