目前随着生物信息学的快速发展,许多生信相关的工具及数据库已经被开发并建立。小编今天就给大家分享一篇发表在Cancers(IF:6.639)杂志上整合利用这些工具及数据库的纯生信范文,不那么擅长敲代码的小伙伴们快get起来呀。文章的思路及方法都不难,但利用了很多生信工具及数据库使其内容丰富,结果清晰,逻辑连贯。长话短说,小编这就带大家一睹为快。
A Bioinformatics Evaluation of the Role of Dual-Specificity Tyrosine-Regulated Kinases in Colorectal Cancer
生物信息评估双特异性酪氨酸调节激酶在结直肠癌中的作用
一、研究背景
结直肠癌(CRC)是全球第三大常见癌症,也是癌症相关死亡的第三大原因,其在年轻人群中的发病率也在不断上升。研究发现双特异性酪氨酸调节激酶(DYRK)家族与包括癌症在内的多种疾病有关。然而,不同家族成员在调控CRC肿瘤发生中的作用和贡献尚未不清楚。因此,文章利用公开的CRC患者数据集和生物信息学网络工具进行计算分析,对DYRK家族成员的表达模式、预后价值以及在CRC肿瘤中的作用进行研究。最终揭示了不同DYRK家族成员在CRC中的作用及其潜在的预后价值。
二、数据及方法
1. Genotype-Tissue Expression(GTEx):为了测量正常结肠组织中DYRKs的表达水平,文章使用了基因组织表达(GTEx)工具,其提供了不同非病变组织中特定基因的表达数据。文章查询了乙状结肠和横结肠组织的DYRKs成员表达。
2. GENT2:为了测量不同CRC亚型中DYRKs的表达水平,作者使用GENT2数据库,通过亚型标签研究了DYRKs在CRC分子亚型中的表达。
3. Gene Expression Profiling Interactive Analysis2 (GEPIA2):为了测量不同CRC分期的DYRKs表达水平,作者使用GEPIA2工具,通过分期标签查询每个DYRK基因,并使用该工具生成CRC患者DYRK的总生存K-M曲线,同时采用Cox回归分析计算风险比。
4. cBioPortal:为了进一步分析肿瘤样本中DYRKs的状态,文章使用cBioPortal基因特异性查询,对于每个DYRK基于z-score对样本进行过滤。
5. GeneSet Cancer Analysis(GSCALite):Gene Set Cancer Analysis (GSCALite)可以预测癌症相关通路的基因活性,作者使用该工具研究了来自TCGA的结肠腺癌(COAD)数据集中DYRKs在癌症相关通路中的作用。
6. STRING:文章使用STRING工具预测了DYRKs的功能蛋白相互作用网络,其中只选择实验蛋白、数据库蛋白和共表达蛋白。
7. TIMER2:TIMER 2能够使用多种算法分析和测量TCGA数据集中的肿瘤浸润免疫细胞。该工具测量感兴趣基因表达和免疫浸润细胞丰度之间的相关性。作者利用这个工具来研究CRC中DYRKs与肿瘤浸润免疫细胞的相关性。
8. UALCAN:UALCAN使用来自TCGA、MET500和CPTAC等癌症数据库的多组学数据,研究不同癌症的表达、甲基化等基因状态与生存的相关性。作者使用该工具研究了DYRKs在正常和肿瘤样本中的表达,并研究了CRC TCGA数据集中DYRKs启动子甲基化状态。
三、主要内容及结果
1. DYRKs在结肠组织中的表达
文章第一部分作者使用GTEx研究了DYRKs在正常结肠组织中乙状结肠和横结肠两个解剖部位的表达水平。结果发现如图1所示,在结肠的两个解剖部位,与其他DYRKs相比,DYRK1A在结肠组织中都有较高的表达水平。DYRK1B和DYRK2在结肠组织中呈中度表达,而DYRK3和DYRK4在结肠组织中低表达。
2. DYRKs基因在正常与结肠和直肠腺癌组织中的表达
接下来,作者评估了DYRKs在结肠和直肠腺癌(COAD)和直肠腺癌(READ)与正常组织的表达水平。作者使用UALCAN 工具中的TCGA RNA-seq数据集,发现DYRK1A和1B没有显著变化(图2a,b),而DYRK2(图2c)在COAD样本中相比于正常组织有显著的低表达。另一方面,与正常组织相比,DYRK3(图2d)和DYRK4(图2e)在COAD样本中均发现显著上调。如图3所示,与正常组织相比,DYRK1A(图3a)和DYRK2(图3c)在READ肿瘤组织中的表达均显著降低,而DYRK1B、DYRK3和DYRK4的表达无显著变化。
3. DYRKs在CRC分子亚型中的表达水平
这一部分作者对结直肠癌主要病理分子亚型中DYRKs的表达水平进行了分析。第一组是微卫星不稳定组(MSI),第二组是微卫星稳定(MSS)。MSS CRC以APC、TP53、PIK3CA、KRAS和SMAD4等多个基因的高体细胞突变率为特征。为了研究DYRK成员在不同肿瘤亚型中的基因表达,作者使用了基于网络的工具GENT2,结果发现MSI与MSS亚型相比,DYRK1A、DYRK3和DYRK4(图4a、d、e)在MSI中均显著升高,而DYRK2在MSS中显著升高(图4c)。DYRK1B在MSI和MSS中的表达无显著差异(图4b)。
4. DYRKs在CRC分期中的表达水平
接下来作者利用GEPIA2,探索了不同CRC分期的DYRKs成员的水平,结果如图5所示,可以观察到从IIIA到IVB期,DYRK1A在肿瘤晚期显著上调(图5a)。DYRK1B表达在CRC分期间无显著差异(图5b)。同样,2类DYRKs表达在CRC分期中无显著差异。这表明在DYRKs成员中,只有DYRK1A在CRC患者肿瘤晚期过表达,提示DYRK1A可能在疾病晚期发挥作用。
5. 结直肠癌中DYRKs的临床特点
在这一部分,作者进一步探索DYRK成员表达水平和CRC临床特征之间的关系。作者首先使用cBioPortal基于DYRK成员表达过滤样本。接着分析了DYRKs和组织学癌症亚型之间的关系。结果发现与从UALCAN观察到的一致,DYRK3和4的表达水平在大多数肿瘤样本中都很高,且作者也发现DYRK1A高表达样本与粘液性结直肠腺癌显著相关(图6a)。
DYRK4也得到了类似结果如图6d所示。另一方面,DYRK1B在非粘液性COAD中的表达高于粘液性COAD亚型(图6b)。对于DYRK3,其在所有三个组织学亚型中的表达均无显著变化(图6c)。此外作者也分析了DYRKs和转移,淋巴结分期及治疗后新肿瘤事件的关系。结果如图7所示,与正常组织相比,DYRK1A在CRC中低表达,但DYRK1A高表达的肿瘤样本在转移和淋巴结晚期富集(图7a,b)。对于其他DYRKs成员,其表达与转移及淋巴结分期之间无统计学差异(图7c-h)。此外,肿瘤样本中DYRK1A水平越高,初始治疗后肿瘤复发越高(图8a)。而其他DYRKs成员均未出现任何显著变化(图8b-d)。这些结果表明,DYRK1A可能作为CRC疾病晚期的潜在肿瘤生物标志物。
6. CRC中DYRKs的突变和启动子甲基化
由于先前分析发现CRC中DYRKs在正常与肿瘤中有差异表达。作者为了确定这种表达变异是否与特定突变有关,使用cBioPortal分析了TCGA中的DYRKs突变。结果发现如图9所示,DYRKs在CRC中一般未发生突变,部分样本存在DYRK1B、DYRK3、DYRK4的扩增突变。对于DYRK1A,存在一个意义未知的错义突变。总的来说,作者发现DYRKs的差异表达与mRNA水平有关。接下来作者使用UALCAN研究不同肿瘤分期中DYRKs基因启动子的甲基化情况。结果发现在COAD中DYRK1A的甲基化水平没有明显变化(图10a),而在READ中,与正常样本相比,3期的甲基化水平明显降低(图10b)。与正常的COAD相比,DYRK1B的甲基化在1、2和3期显著增加(图10c),在READ中,与正常样本相比,甲基化在1期显著增加,在第4期显著降低(图10d)。且DYRK2仅在COAD的4期甲基化水平较低(图10e),而在READ中未观察到显著变化(图10f)。作者研究正常与肿瘤样本的mRNA表达,也发现在COAD中DYRK3(图10g)和DYRK4(图10i)的甲基化水平明显低于对照组。在READ中,只有DYRK4在1和4期中甲基化水平较低(图10i)。这些结果表明,正常与肿瘤中DYRKs表达的差异可能与表观遗传调控有关,而不是基因突变。
7. DYRKs在CRC中癌症相关通路中的活性
这一部分,在探索了DYRKs在CRC临床特征中的状态后,作者使用GSCALite预测DYRKs在COAD中的分子功能(图11)。结果发现1类DYRKs (1A和1B)和DYRK4与细胞周期抑制相关。然而,DYRK1B也与凋亡抑制、DNA损伤反应和PI3K/AKT通路激活相关。DYRK2与抑制DNA损伤反应相关,而DYRK3与上皮间质转化和雌激素通路正相关。这些表明DYRKs可能在多个癌症相关通路中发挥重要作用。为了进一步预测DYRKs在癌症中的功能,作者使用STRING来预测DYRKs的相互作用对,发现DYRK1A与参与细胞周期抑制的DREAM复合体相互作用。此外,它与参与DNA损伤反应的泛素连接酶RNF169相互作用。作者也发现DYRK1B与信号诱导增殖相关,这预测了它在DNA损伤中的作用。DYRK1B的另一个相互作用因子是LZTS2,它是β - catenin的负调控因子,提示它与结直肠癌有关。最后,作者发现所有DYRK成员都与DCAF7有功能关联。
8. CRC患者DYRKs与肿瘤浸润免疫细胞的相关性研究
接下来作者使用TIMER 2来探索CRC 中DYRKs表达和肿瘤浸润的免疫细胞之间潜在的相关性。结果发现如图12所示,DYRK1A与CD4+ T细胞、巨噬细胞和髓样树突状细胞呈显著正相关,与CD8+ T细胞和B细胞无显著相关。对于DYRK1B,只发现与CD4+ T细胞和巨噬细胞有显著正相关。虽然DYRK2在MSS亚型中表达较高,但其表达与CD8+ T细胞、CD4+ T细胞、巨噬细胞、髓样树突状细胞呈正相关。此外,DYRK3也被发现与CD8+ T细胞、CD4+ T细胞、巨噬细胞和髓样树突状细胞呈正相关。DYRK4与免疫浸润细胞无显著相关性。综上所述,可以发现只有DYRK1A和DYRK3在MSI亚型中表达上调,且其表达与免疫浸润细胞呈正相关。
9. 无进展生存率(PFS)
这一部分作者基于来自cBioPortal的Pan TCGA数据进行分析,发现DYRK1A高表达的CRC样本PFS显著较低(图13a)。然而,对于其他DYRKs,未观察到PFS的显著变化(图13b-d)。这些结果与上述一致,进一步支持了DYRK1A在晚期CRC肿瘤中的表达可能反映患者预后不良的观点。
10. 总体生存(OS)
在最后一部分,作者为了进一步证实在cBioPortal中的发现,对总生存期进行了Kaplan-Meier分析。结果观察到DYRK1A表达较高的CRC患者总生存期明显较低(图14a),而其他DYRK成员与总生存期没有任何显著相关性(图14b-f)。这表明DYRK1A的表达不同于其他DYRK成员,可以预测CRC中的癌症生存期。
到这里这篇文章的主要内容就介绍完了,文章从DYRK家族入手,整合并利用多个工具及数据库,结合甲基化、突变、表达等数据分析了DYRK与CRC的预后、临床特征等的关系。同时文章也涉及了DYRK与免疫及功能等相关分析,文章的内容丰富,角度全面,条理清晰,这种思路及方法非常值得我们学习借鉴,选对角度利用好这些工具及数据库,不用怎么敲代码也可以发6+,简直是生信小白的福利呀。
参考文献
A Bioinformatics Evaluation of the Role of Dual-Specificity Tyrosine-Regulated Kinases in Colorectal Cancer.