预后模型的构建思路相信各位小伙伴已经烂熟于心了,一般是基于基因表达、甲基化或者突变等多个基因组指标的一个或多个构建预后模型并进行验证,进而将其扩展到泛癌水平。但在今年4月15日EBioMedicine(IF=8.143)发表的这篇低级别胶质瘤的预后模型文章却让人眼前一亮,作者运用多种临床指标与基因表达构建低级别胶质瘤预后模型对患者预后显示出了良好的预测效能。多种指标是如何整合在一起的?快来和小编一起看看吧!
APOLLO: An accurate and independently validated prediction model of lower-grade gliomas overall survival and a comparative study of model performance
APOLLO:一个准确且独立验证的低级别胶质瘤总生存率预测模型和模型性能的比较研究
一.研究背景:
胶质瘤是大脑和中枢神经系统最常见的恶性肿瘤,占恶性脑肿瘤的80%以上。低级别胶质瘤(LGG)由弥漫性低度和中度胶质瘤组成,与胶质母细胞瘤(GBM)的患者相比,LGG患者预后更佳。然而几乎没有准确和稳健的低级别胶质瘤(LGG)生存预测模型存在,已有的预测模型仅仅进行了有限的模型验证,因为大多数模型要么依赖于训练种群或在测试种群中再训练模型来评估模型性能,会由于过拟合而被高估。于是作者通过结合人口统计学、临床信息以及具有主要效应的基因-基因相互作用的转录生物标志物来构建LGG准确且独立验证的预后预测模型APOLLO,作者还将其开发为一个在线工具,供研究者免费使用。
二.主要结果
1.APOLLO的开发与构建
作者首先收集整理了TCGA-LGG、中国胶质瘤基因组图谱(CGGAⅠ)、CGGA2、GSE108476、GSE61374和GSE16011共6个胶质瘤队列的临床及基因表达数据。作者使用了由COSMIC定义的723个泛癌驱动基因中6个队列共享的680个基因,共1420个LGG样本进行后续的研究。图1描述了作者研究的工作流程。
对于主要效应分析及G×G互作分析使用两个Cox模型:
Model1: h(t)=h0(t)exp(α × gene + ∑βi × covariatei)
Model2: h(t)=h0(t)exp(α1 × gene1 + α2×gene2 +
α3×gene1×gene2 + ∑βi × covariatei)
并且矫正了协变量,包括年龄,WHO分级,IDH突变和1p/19q状态。在这一步,作者识别了与TCGA队列总生存率相关的42个主效应基因和307对G×G互作基因,其中28个主效应基因和27对G×G互作基因在CGGA1队列中被验证为候选转录预测因子。接下来作者在TCGA训练队列中通过正向逐步回归对候选转录因子筛选以构建最终的Cox模型,最终的模型包括5个主效应基因和4对G×G互作基因。通过Cox模型的系数估计,图2将APOLLO_Score和Transcriptional_Score进行定义。
2.APOLLO的转录预测因子及其免疫相关性
通过KEGG富集分析发现基因富集到包括胶质瘤通路在内多条通路,GO注释鉴定出279个生物过程通路、24个分子功能通路和20个细胞成分通路,提示潜在的生物功能。作者通过中位Transcriptional_Score将患者分为高风险组和低风险组,发现两组间22种免疫细胞比例存在显著差异(图3A);Transcriptional_Score与基质得分,免疫得分和ESTIMATE得分相关(图3B),此外,作者还观察到转录预测因子和免疫检查点基因之间的高连通性和高相关性(图3C)。因此,APOLLO可能在指导免疫治疗方面有潜在作用。
3.APOLLO的预测效能及验证
接下来作者对APOLLO进行多种验证。首先通过APOLLO打分中位数将TCGA训练集和测试集样本分为两组。在TCGA队列和CGGA1队列以及4个外部测试集中,高危组较低危组具有较差的生存,且显示出较大的风险比(HR)值(图4a-f)。进一步作者为了证实APOLLO的鉴别能力,通过五分位数将患者分为6组。中位生存期随着APOLLO得分的分组升高而急剧降低,得分最高的组与较短的生存期和较高的死亡风险相关(图4g-h)。
在TCGA和CGGA1中,APOLLO相当准确地预测了36和60个月的生存率(图5a-b),在外部测试集中也展现出良好的预测能力(图5c-f). 此外,APOLLO在TCGA训练队列和CGGA1内部测试队列以及4个外部测试队列中均表现出良好的c指数(图5i)。
以36个月生存期为重点,APOLLO与无干预且具有合理阈值概率的策略相比,APOLLO模型的净收益(NB)高于基本模型(图6a),这意味着APOLLO可以减少55.4%的不必要的临床干预(图6b)。敏感度的分析显示,APOLLO的决策曲线也高于其他策略,且在36个月和60个月的平均NB和 NR均为最佳(图6a-e)。在进一步的评估APOLLO的稳健性中,作者进行了全方面的亚组分析。在所有的亚种群中,APOLLO均表现出较好的鉴别能力。
以上文章的大体内容就介绍完啦,下面应该是小伙伴们最关心的如何应用作者构建的APOLLO预测模型啦。作者将其成果开发了一个在线网站(http://bigdata.njmu.edu.cn/APOLLO/)供大家免费使用,且不需要任何编程功底哦。
我们打开网站主页,页面做的也相当精美,首先映入眼帘的便是APOLLO的介绍与实例结果(图7)。
接下来我们来学习一下如何使用呢。如图所示,在左侧我们可以输入患者的临床指标,如年龄、分级、IDH突变状态,1p/19q状态以及是否需要添加转录组打分。
在我们选择需要添加转录组打分后,点击Edit score,就需要我们添加各个基因的log2的基因表达值。点击OK,在Edit score旁就会实时出现作者在文中所计算的APOLLO打分。
通过改变基因的表达值,结果也都是实时显示的,右侧显示了LGG患者36个月以及60个月的总生存率预测及预测曲线。ROC曲线展示了模型的预测效能,nomogram图也进一步的验证解释结果。
总的来说,作者通过整合多种临床及基因组转录组指标,构建了低级别胶质瘤稳健且易于实现的预后预测模型,结合多套数据集进行验证,严谨可靠。开发的网站非常简介美观,使用基本不存在难点,且可以实时展示结果。这为我们构建预后模型的工作也提供了一定的思路,不再局限于筛基因特征,适当的加入一些临床及多组学指标可能会使模型的效能更好哦。小伙伴们快快学起来!