哈喽,好久不见~你们可爱勤劳的SHZ小编又回来啦~回归的第一天,先带大家解读一篇预后风险模型相关的文章,题为“The Aging-Related Prognostic Signature Reveals the Landscape of the Tumor Immune Microenvironment in Head and Neck Squamous Cell Carcinoma”,近期刚刚发表在Frontiers in Oncology杂志上(IF:6.244)。虽然简单,但是干活满满!小编更是头悬梁锥刺股,呕心沥血地为你们总结了预后风险模型的万能公式——“找、筛、建、验、挖”。
数据来源
TCGA:https://portal.gdc.cancer.gov/
MSigDB:http://www.gsea-msigdb.org/gsea/msigdb/index.jsp
IBERSORT:http://cibersort.stanford.edu/
TIMER:https://cistrome.shinyapps.io/timer/
结果解读
1.“找”—寻找HNSCC差异表达衰老相关基因
从TCGA数据库下载头颈部鳞状细胞癌(HNSCC)患者的RNA测序数据和临床随访数据,包括502个肿瘤样本和44个非肿瘤样本。从MSigDB数据库获得11个已知的与人类衰老相关的基因集,将这11个基因集作为预定义的衰老相关基因集。将TCGA数据库中获得的HNSCC患者的测序基因与与预定义的衰老相关基因集进行比较,发现其中7个基因集在HNSCC样品中显著富集,如图S1。
对上述7个基因集进行LEA分析(leading edge analysis),共鉴定出134个核心富集基因,定义为衰老相关基因(AGs)。然后,根据肿瘤和非肿瘤样品中所有核心富集基因的表达,共获得41个显著上调的AGs,并分别用三种不同的绘图方式(火山图、热图、箱式图)可视化这41种AGs的表达模式,如图1。
2.“筛”—筛选预后相关的衰老相关基因
通过单变量Cox回归分析,获得12种差异表达的AGs(DKK1,SERPINE1,ADA,HMGA2,APP,CDKN2A,MIF,NEK6,ADM,BAK1,CDK6和PRNP)与HNSCC患者的OS显著相关,如图2A;
通过LASSO Cox回归分析,消除预后相关的假阳性AGs,进一步筛选了7个AGs,包括BAK1,DKK1,CDKN2A,ADA,APP,MIF和ADM,如图2B、S2。
通过多因素Cox回归分析评估这7种预后相关AGs对HNSCC患者OS和临床结局的影响(p <0.05,图2B)。最后鉴定出具有独立预后值的BAK1、DKK1、MIF和CDKN2A等4个AGs,用于OS预测,并进一步应用于建立预后风险模型。
3.“建”—构建衰老相关基因预后风险模型
通过LASSO Cox回归分析构建了从四种选定的AGs中提取的预后风险模型,其中BAK1,DKK1和MIF被鉴定为高风险基因,而CDKN2A被鉴定为低风险基因。风险评分公式如下:风险评分 = (0.2126) * BAK1 + (0.137) * DKK1 + (-0.0716) * CDKN2A + (0.2474)*MIF。
4.“验”—验证所构建预后风险模型的准确性
在训练队列(整个数据集,n = 502)和测试队列(随机选择,n = 250)中验证了AGs签名的预后价值。Kaplan-Meier生存分析显示,在训练和测试队列中,高风险组患者的OS比低风险组的患者短(p <0.001;图3A-B)。训练队列中 AGs签名的 ROC 曲线的 2 年、3 年和 5 年 AUC 值分别为 0.663、0.676 和 0.652(图 3C)。测试队列中ROC曲线的相应2年,3年和5年AUC值分别为0.660,0.684和0.709(图3D)。这些数据共同揭示了四种选定的AGs用于HNSCC预后的风险模型的准确性。
5.“挖”—挖掘预后风险模型与其他因素的潜在关联性
【小编有话说】
通过前面的分析,我们已经初步构建了一个相对准确可靠的预后风险模型,但是如果想要发表高分文章,仅仅构建了一个预后风险模型,内容略显单薄,此时,我们就要充分发挥这个模型的潜在价值,进一步挖掘预后模型与其他因素的关联性,包括但不限于临床病理特征、免疫评分及免疫细胞浸润水平、免疫检查点和免疫检查点阻断反应等(此处应该吹个牛皮儿:没有生信做不到的,只有你想不到的)。
接下来言归正传,我们以本文为例,带你领略风险预后模型的“附加玩法”
5.1)风险模型与总生存期及临床病理特征的相关性
通过Wilcoxon检验比较年龄、肿瘤分级、病理TNM分期、病理T分期、病理N分期、性别、治疗方法等亚组间的风险评分差异,探讨风险模型与HNSCC患者临床病理特征的相关性,如图4。结果发现,风险评分与肿瘤分级和病理性T分期显著相关,而与年龄,病理TNM分期,病理性N期,性别和治疗方法没有关系(图4A)。此外,单因素Cox回归分析显示,HNSCC患者的年龄,病理性N期和病理性TNM分期与OS显著相关(图4B)。多因素Cox回归分析显示,年龄、病理性N期、病理性TNM分期和放疗与HNSCC患者的OS有明显相关性(图4B)。为了提供整合年龄、病理性N分期、病理性 TNM 分期和放疗的 HNSCC 预后,构建了生存预测 C 指数为 0.764 的列线图(p < 0.001)(图 4C)。2年、3年和5年OS列线图模型的校准曲线显示列线图预测与实际观察结果之间具有良好的一致性(图4D)。
此外,按照年龄(<60岁和≥60岁),性别(男性和女性),肿瘤分级(I级,II级和III级),病理性TNM分期(I-II期和III-IV期),病理性T期(T1-2和T3-4), 病理性N期(N0和N1-2)和治疗方式(放射治疗和药物治疗)分为不同的亚组,进一步进行分层生存分析,如图5。
结果显示,除病理性 T1-2 亚组外(5J),在其余所有亚组中,高危组患者的OS明显低于低危组(图 5A-I, K–O)。这些结果表明,所鉴定的4-AGs风险模型对HNSCC的预后具有可靠的预测价值。
5.2)风险模型与免疫评分及免疫细胞浸润水平的相关性
首先研究了免疫评分与风险评分之间的关联。高危组的免疫评分显著低于低危组(p <0.001)(图6A)。随后,通过CIBERSORT评估了高危和低危组之间22种免疫细胞的浸润水平差异(图6B)。结果发现,与低危组相比,高危组患者中记忆B细胞(p <0.05),CD8+ T细胞(p <0.001),滤泡辅助T细胞(p <0.001),调节性T细胞(Tregs)(p <0.001)和活化肥大细胞(p <0.001)浸润水平较低,而静息状态NK细胞(p <0.01)、M0巨噬细胞(p < 0.01)、 M2巨噬细胞(p < 0.05)、静息状态肥大细胞(p < 0.001) 的浸润水平较高。然后,作者进一步探索上述九种免疫细胞类型与风险模型中所选AGs的关联(图6C-F)。
此外,基于TIMER数据库对六种类型免疫细胞的风险评分和浸润水平进行了相关性分析,以评估4-AGs风险模型对HNSCC患者肿瘤免疫微环境(TIME)的影响(图7)。结果显示,风险评分与B细胞(p <0.001,图7A)、CD4 + T细胞(p <0.001,图7B)和CD8 + T细胞(p <0.05,图7C)浸润水平呈显著负相关,而风险评分与嗜中性粒细胞(p >0.05,图7D)、巨噬细胞(p >0.05,图7E)和髓状树突状细胞(p >0.05,图7F)的浸润水平未发现显著负相关。
为了探究AGs在TIME上的作用机制,作者进一步研究了6种免疫细胞与4种AGs之间的关系,如图8。结果显示,与BAK1低表达组相比,BAK1高表达组中CD8 + T细胞(p <0.05)和嗜中性粒细胞(p <0.001)的浸润水平显著较高,而B细胞(p <0.001)的浸润水平较低;在6种免疫细胞中,只有B细胞与DKK1的表达水平呈负相关(p <0.001,图8B),但对于CDKN2A,只有B细胞与CDKN2A的表达水平呈正相关(p <0.05,图8C)。与MIF低表达组相比,MIF高表达组中B细胞,CD4 + T细胞,CD8 + T细胞,嗜中性粒细胞,巨噬细胞和髓系树突状细胞的浸润水平均显著降低(所有p<0.05,图8D)。以上结果证明,风险模型中选择的4个AGs(BAK1,DKK1,CDKN2A和MIF)在调节HNSCC患者TIME方面具有重要功能。
5.3)风险模型与免疫检查点和免疫检查点阻断反应评分的相关性
计算CD274、CTLA4、HAVCR2、LAG3、PDCD1、PDCD1LG2、TIGIT和SIGLEC15等8个免疫检查点基因的表达水平,探讨免疫检查点与风险评分和4个选定AGs的相关性。 结果发现,在HNSCC高危组中,CTLA4,PDCD1和TIGIT的表达下调,而PDCD1LG2表达上调(图9A)。BAK1与CD274,LAG3和PDCD1LG2的表达呈极显著的正相关,而与SIGLEC15的表达呈负相关(图9B)。DKK1与PDCD1LG2的表达呈正相关,而与TIGIT的表达呈负相关(p<0.05,图9C)。CDKN2A与PDCD1表达呈正相关(p <0.05,图9D)。MIF与CD274,CTLA4,HAVCR2,PDCD1,PDCD1LG2和TIGIT的表达呈显著负相关(p <0.05,图9E)。此外,作者还评估了按风险评分和四种选定的AGs分层的高危组和低危组中免疫检查点封锁(ICB)反应评分的差异。结果显示,与低风险亚组和低表达亚组相比,高风险亚组、高DKK1表达亚组和高MIF表达亚组的ICB反应评分显著升高(p <0.001,图9F)。
总结
作者构建了四个AGs (BAK1、DKK1、CDKN2A和MIF)的预后风险模型,并在训练和测试数据集中进行验证。Kaplan-Meier曲线和ROC曲线分析证实,AGs风险特征对HNSCC患者的预后具有准确的预测价值。相关分析显示,风险评分与免疫评分、免疫细胞浸润水平呈负相关,与免疫检查点封锁(ICB)反应评分呈正相关。高危组患者中,静息状态NK细胞、M0巨噬细胞、 M2巨噬细胞、静息状态肥大细胞的浸润水平较高,而记忆B细胞,CD8+ T细胞,滤泡辅助T细胞,调节性T细胞(Tregs)和活化肥大细胞浸润水平较低。高危组中CTLA4、PDCD1、TIGIT表达下调,而PDCD1LG2表达上调。此外,在风险模型中选择的4个AGs在HNSCC的免疫细胞浸润和ICB反应中具有重要作用。
不是废话的废话
有人说预后风险模型已经烂大街了,一点也不高大上,也发不了好文章了,但是为什么现在仍然可以看到很多优秀的预后风险模型文章如雨后春笋般出现呢?吃不到葡萄说葡萄酸的童鞋们,您可长点心吧!过时落后的不是预后风险模型,而是老旧思维模式。小编总结预后模型5步玩转法—“找、筛、建、验、挖”,可以说是所有预后风险模型的经典模式,“找、筛、建、验”是基础,“挖”是升级,也是一篇文章的灵魂,感兴趣的小伙伴,赶快学起来吧~