小伙伴们大家好哇!今天依然给大家介绍预后模型构建的文章,快来和小编一起看看这篇今年7月13号发表在Journal of Oncology(IF=4.501)上的预后模型的文章吧!
A Novel Thrombosis-Related Signature for Predicting Survival and
Drug Compounds in Glioblastoma
一种预测胶质母细胞瘤生存和药物化合物的血栓相关新特征
一.研究背景
胶质瘤是中枢神经系统最常见的原发性恶性肿瘤,约占成人原发性恶性脑肿瘤的80%。GBM患者的总生存期为1~15年,且个体差异较大。随着测序技术和分子诊断技术的发展和应用,目前临床上已经建立了较为客观准确的肿瘤分类体系。然而,目前已知的分子标志物只能部分解释GBM患者的预后。
静脉血栓栓塞(VTE)包括深静脉血栓(DVT)和肺栓塞(PE),广泛发生于各种癌症,包括GBM。GBM静脉血栓栓塞发生率高,易发生并发症。除了VTE外,胶质母细胞瘤内血栓形成可能因血管阻塞引起缺血或坏死,也是影响胶质母细胞瘤患者预后的重要因素。既往研究表明血栓形成相关基因介导GBM转移、血栓形成等生物学过程,提示血栓形成相关基因改变可能在胶质母细胞瘤的诊断和预后预测中发挥重要作用。于是作者对血栓相关基因通过多组学筛选并构建了一个胶质母细胞瘤的独立预后风险打分模型,旨在为GBM的分子诊断和个体化治疗提供帮助。
二.主要结果
1.基于血栓形成相关基因的GBM预后风险评分模型的构建与验证
整体研究设计如图1所示。作者首先通过在文献中查找到140个与血栓形成相关的基因,其中124个基因在TCGA和CGGA数据集中有表达,作者选择这些基因进行后续分析。
为了确定GBM中与预后相关的血栓形成相关基因,通过对TCGA训练级进行LASSO回归分析,从124个基因中筛选出13个基因(图2a、b)。然后作者基于13个基因的LASSO回归系数构建了血栓相关基因表达风险评分模型,公式为我们常规的13个基因的表达值乘以系数值的累加和,在此我就不进行详细描述啦。接下来作者根据risk score的中位数将TCGA训练集的样本分为高危组及低危组。如图2c和图2d所示,高危组患者OS明显低于低危组患者。通过timeROC分析显示,风险评分模型的AUC值为0.752,证明了该风险评分模型在TCGA训练队列中对患者预后具有良好的准确性和预测能力(图2e)。
接下来,作者对血栓相关基因表达风险评分模型进行了多数据集的验证。首先作者在TCGA测试集和总数据集中进行验证,在测试集中图2(f)和图3(i)的结果显示出与相同趋势的结果,即高危组GBM患者的预后生存明显短于低危组,TCGA测试集和总数据集的ROC曲线分别为0.658和0.704(图2h和3k)。
CGGA数据进一步验证显示高危组GBM患者预后较低的趋势相似(图3m),ROC曲线的AUC为0.714(图3n),CGGA数据集中风险评分分布及患者生存状态如图3l所示。这些发现表明,基于血栓相关特征的风险评分模型对患者OS具有良好的生存预测能力。
2. 血栓形成相关基因signature的功能富集分析
为了探索预后性血栓形成相关基因signature在GBM中的潜在生物学功能,作者使用了GSVA分析。图4a展示了GO富集分析、KEGG分析及HALLMARK分析结果。此外,作者为了按研究血栓相关基因的表达与已知的signature的相关性,如图4b所示,低危组与高危组在APM表达、细胞周期调控、EMT2、FGFR3相关信号、组蛋白、免疫检查点、核苷酸切除修复和pan_f_tbr信号等方面存在显著差异。m6a相关基因在低危组和高危组也具有明显差异(图4c)。
3.血栓形成相关预后基因的免疫功能分析
基于ESTIMATE、MCP-counter、TIMER和xCell算法,作者分析了TCGA数据集中风险评分与免疫因素间的相关性。如图5所示,风险评分与Tumor Purity呈负相关,与Stromal score、Immune score、ESTIMATE score呈正相关;此外,基于MCP-counter进行风险评分与免疫细胞亚群的相关性分析显示,风险评分与细胞毒性淋巴细胞和NK细胞负相关,而与单核细胞系、髓样树突状细胞、中性粒细胞、内皮细胞和成纤维细胞正相关;TIMER对风险评分与免疫细胞亚群进行相关性分析和xCell也显示风险评分与B细胞、CD8+细胞、CD4+细胞、中性粒细胞、巨噬细胞和树突状细胞(DC)相关。
4. 血栓形成相关预后基因的体细胞突变分析
在此部分,作者分析了TCGA-GBM数据集中经过血栓形成相关基因的GBM预后风险评分模型分组的高危组和低危组之间的体细胞突变差异。在低危组中,超过10%的样本中有16个基因发生突变,而在高危组中只有12个基因符合标准,其中9个基因重叠(图6a)。有趣的是,TP53、TTN、PTEN和EGFR在低危组和高危组中突变频率均占据前四位,它们相互作用调控GBM相关的各种生物学过程,提示它们可能参与了肿瘤的恶化。此外,目前已发现的GBM前致病基因(IDH1、TP53、ATRX、NUP16、TIAM2、NEK10和ABCA1)在高危组和低危组之间的突变频率存在显著差异(图6b)。
接下来,作者通过CoMEt算法对25个最常见的突变基因进行了共发生和特异突变进行了研究。HYDIN和FLG、AHNAK和SYNE1、NF1和LRP2基因共发生突变(图6c),这表明它们在同一通路中可能存在互补作用。
5. 高危患者潜在治疗药物的鉴定
为了确定具有高危评分的GBM患者的潜在治疗药物,作者分析了PRISM和CTRP-derived的药物反应数据。作者首先筛选在高风险和低风险组中反应不同的候选药物,以识别具有高风险评分的患者中具有较高药物敏感性的化合物。候选药物符合两个标准:药物在高、低风险人群中反应敏感度不同;采用候选药物AUC估计值与风险评分之间的Spearman相关分析,选择相关系数为负的化合物。分析得到9个PRISM衍生化合物(图7e和f)和3个CTRP-derived化合物(图7g和h)。所有这些化合物在高危组中AUC值均较低,且与风险评分呈负相关(图7e、h)。
接下来作者对低危和高危GBM患者的临床和分子特征进行了研究。作者对不同组的临床病理特征进行风险分层分析,以评估风险评分模型的预后价值。众所周知,老年是恶性胶质母细胞瘤的危险因素。如图7a所示,在TCGA GBM队列中,年龄在65岁以下的GBM患者和65岁及以上的高风险评分的GBM患者的预后均较低风险评分的GBM患者差。目前,IDH突变被认为是预测GBM患者预后的分子标记。在TCGA-GBM和CGGA数据集中作者发现,高风险评分的IDH野生型患者预后较差,再IDH突变患者中也发现了同样的趋势(图7b)。图7c和图7d显示显示未接受放疗和化疗的高危组患者预后最差。相比之下,接受放疗或化疗的低风险组患者的预后最好。以上结果证明基于血栓相关基因的风险评分模型可作为GBM患者独立的预后因素。
6. 胶质母细胞瘤临床特征风险模型的构建与评估
在此部分,作者根据血栓相关特征和临床因素(年龄、性别、IDH突变状态、放疗和化疗)建立了一个nomogram图预测1年、2年和3年总生存期的风险评分(图8a)。校准图显示,nomogram预测TCGA GBM和CGGA队列的1年、2年和3年OS的能力较为良好,预测的2年OS接近于实际的2年OS(图7b和7e)。根据临床特征的风险模型,生存曲线显示高危组和低危组的OS存在显著差异(图7c和7f)。如图7(d)和7(g)所示,TCGA和CGGA队列的ROC曲线的AUC分别为0.765和0.785,表明临床特征风险模型比基于血栓相关基因标记的风险评分模型具有更好的准确性和稳定性。
自此,这篇文章就介绍完啦,总结一下:作者首先基于筛选了与GBM患者预后显著相关的血栓形成相关基因构建预后模型,然后进行多角度验证,通过富集分析发现预后相关的血栓形成相关基因在多种癌症通路和功能上富集,验证模型的稳定性及可行性;通过风险打分的高低分组关联基因突变等多组学分析以及联合临床特征分析进一步升华主题。简单来讲,这还是我们熟悉的预后模型构建思路,通过变换基因集和疾病极好复现,前提是这个基因集在你所研究的疾病中务必要有一定的意义。快快动起来,下一个发文章的就是你喽!