今天给大家分享一篇2022年2月24日发表在Genome Medicine(IF:11.117)上,结合突变和免疫治疗数据构建泛癌预后模型的文章,如果觉得纯生信工作过于单薄的小伙伴可以来看一下,整合公共数据是如何发到10分+的。
A mutation-based gene set predicts survival benefit after immunotherapy across multiple cancers and reveals the immune response landscape
基于突变的基因组预测多种癌症免疫治疗后的生存获益,并揭示免疫反应图谱
一.文章背景
免疫检查点抑制剂疗法(ICI)彻底改变了许多癌症的治疗。然而受益于ICI治疗的人群有限,在临床上有指示作用的标志物(如TMB)并不能有效预测患者对于ICI 的治疗反应。因此,有必要筛选预测标志物对患者分层,预测ICI 的治疗效果,提高患者的生存效益。今天小编就和大家分享一篇基于突变数据、跨癌症类型预测ICI治疗效果的文章。
二、数据及方法
数据来源:作者收集了cBioPortal数据库中Samstein MSK-IMPACT (n=1661)的突变和免疫治疗数据作为训练集,从8个已发表的工作中(PMID: 31792460、PMID: 29443960、PMID: 30150660、PMID: 29301960、PMID: 29033130、PMID: 26997480、PMID: 26359337、PMID: 25409260)收集数据作为验证集。并使用TCGA中突变、拷贝数、mRNA表达数据针对预测模型鉴定的亚组进行分析。
2、PSM加权算法:为了平衡MSK-IMPACT 数据集中突变和野生型之间潜在混杂因素,在此研究中作者使用PSM加权算法处理数据,先使用逻辑回归分析计算倾向得分,令突变基因组和野生型基因组之间加权倾向得分的标准差小于10%;再使用多因素COX回归筛选生存相关基因,使用permutation test随机100次确定统计学意义。
3、基于突变基因集筛选预测基因:使用PSM分析,LASSO惩罚COX回归分析,最后使用多因素COX回归构建风险评分模型。根据X-tile 3.6.1软件确定最佳临界值,将患者分为低风险和高风险评分组。
4、免疫分析:使用CIBERSORT评估免疫细胞浸润水平。TIL 分数、白细胞分数和淋巴细胞分数从Thorsson、Saltz等人的研究中获得。从 Danaher 等人的TCGA 泛癌研究中提取免疫浸润评分。从 He 等人获得29个经典免疫特征,ssGSEA来量化每个样本中29个免疫特征的富集水平。使用ABSOLUTE计算肿瘤间异质性。
5、其他分析:CYT被定义为GZMA和PRF1表达的几何平均值。“MutationalPatterns” 包进行NMF分析,通过余弦相似性将突变剖面与COSMIC特征进行比较。GISTIC 2.0处理拷贝数数据,使用clusterProfiler包进行富集分析,使用Kaplan-Meier方法比较生存差异,C-index表示预测准确性,Wilcoxon检验对两组进行比较进行统计分析。
三、结果
1、基于突变鉴定用于预测免疫治疗结果的的基因集及验证
作者筛选了468个肿瘤抑制基因、癌基因以及被认为可用于靶向治疗并获得美国 FDA 授权的通路基因作为候选基因进行筛选。先使用PSM算法筛选出98个候选基因,然后使用LASSO惩罚COX回归模型,随机1000次筛选出现超过990次的基因为预后相关基因,共得到11个预后相关基因,量化每位患者的风险得分,使用X-tile软件生成最佳临界值。作者发现患者的低风险组的OS比高风险组要长(图1B),且各亚组无论年龄、药物类型或者癌症类型如何,低风险组的OS都要比高风险组的要长(图1C-E)。
2、验证用于预测免疫治疗结果的突变基因集
KM生存曲线显示,验证集与训练集相同的趋势(图1F)。作者还比较了基于突变基因集的性能和训练队列中现有的基于突变的ICI响应特征(如UV、APOBEC和DNA损伤响应通路等),使用C-index指数进行量化,发现基于突变基因集的C-index指数是最大的。作者还和TP53、B2M等基因的性能作比较,发现基于突变基因集的性能是最好的。这篇文章中指出低风险组的ICI治疗有显著的DCB(图1G),低风险组的患者更可能对ICI治疗有反应(图1-H),并在验证集中取得进一步证实(图1I和J)。
3、基于突变的基因组是免疫治疗后预后的一个独立预测因素
COX回归分析显示,无论是在训练集还是验证集基于突变的基因集与OS相关,且均为独立的预测因素(图2A和B)。为了确定哪个因素具有最佳预测性能,使用 C-index来比较训练和验证队列中基于突变的基因集与 TMB 和药物类型之间的性能,结果表明基于突变的基因组能更准确的预测预后(图2C),验证集展示了同样的效果(图2D)。
4、基于突变的基因组、疾病分期、CTL和6-IFN-g基因特征可以结合起来预测ICI治疗的临床效益。
通过ssGSEA方法发现,与高危组相比,低危组显示出更高的 2-gene cytolytic得分(P = 0.071),6-gene IFN-g 得分(P < 0.05),和18-gene IFN-g 得分(P < 0.05)。将基于突变的基因集、疾病分期、CTL 和 6 基因 IFN-g 基因特征整合到 ICI 治疗的预测列线图中(图2E),列线图在观察值与预测值之间显示出良好的一致性(图2F)。
5、高风险和低风险群体的潜在外在免疫景观
将风险评分系统应用于TCGA队列(图3A),基因组水平的比较显示,低风险组的白细胞、淋巴细胞和 TIL 分数高于高风险组(图3B-D),使用其他方法评估也得到同样的结论(图3E-F)。根据 Danaher 等人的免疫浸润评分分析显示,低风险组有更多的免疫细胞(图3G-H)。使用无监督聚类根据免疫特征评分对TCGA队列患者进行聚类,结果显示了两种不同的免疫模式,即高水平和低水平的免疫浸润(图3I-J)。此外,在低风险组中,肿瘤部位的免疫特征评分明显高于正常部位;相反,高危组在肿瘤部位的免疫特征评分明显低于正常部位(图4A),低风险组免疫活动之间的相关性高于高风险组(图4B-C)。GSEA结果显示,在低风险组中,有13条通路明显富集,包括6条免疫相关通路(图4D),相比之下,高风险组没有富集到任何免疫相关的通路。低风险与明显较高的CYT评分有关(图4E),并且在高风险组中有明显较多的纤维细胞(图4F),低风险组在肿瘤部位显示出丰富的免疫细胞,对ICI治疗更容易响应,而高风险组的成纤维细胞可能有助于外在的免疫逃逸。此外,作者发现低风险组中趋化因子的表达更高(图 4G-H),由此推断趋化因子的富集可能会在低风险组中引发免疫反应。
6、高风险和低风险群体的潜在内在免疫景观
低风险组显示出比高风险组更高的突变率和新抗原负荷,以及更高的 TCR 多样性和 BCR 多样性;与低风险组相比,高风险组表现出更高的 CNV 负荷和非整倍性,表明肿瘤非整倍性与对免疫治疗的反应降低和免疫逃避标志物有关,同时高风险组的瘤间异质性高于低危组(图 5A),高免疫原性可能会在低风险组中引起外在免疫反应。根据体细胞突变数据描绘了突变特征,并在来自 TCGA 的队列中确定了四种不同的诱变模式(图5B),在低风险组中发现这四个特征的频率明显高于高风险组(图 5C)。计算了低风险和高风险人群中 10 种常见致癌通路中致癌基因的富集分数。细胞周期、Hippo、NRF2、PI3K 和 TP53 通路在低风险组中得分较高,而 MYC 和 Wnt 通路在高风险组中富集(图 5D)。与低风险组相比,高风险组表达较少量的 MHC I 和 II 相关抗原呈递分子导致内在免疫逃逸,低风险组大多数 MHC 基因的表达较高,这表明免疫原性更强。作者还发现免疫检查点分子(如 PD-1、PD-L1 和 CTLA4)和共刺激分子在低风险组中的表达高于高风险组(图 5E)。
7、高低风险人群的拷贝数特征
在高风险组和低风险组之间有染色体畸变的显著差异(图 6A)。与高风险组相比,在低风险组中观察到特征明显的免疫基因如 PD-L1(9p24.1)和 PD-L2(9p24.1)的局部扩增峰(图6B-C)。Venn显示,两组共有692个拷贝数扩增的基因,高危组和低危组分别有310和1218个基因被特异性扩增(图 6D)。使用Gene Ontology 中的注释信息对这些扩增基因进行注释,并对前10的生物学过程进行聚类,低风险组显著富集了 2 个免疫相关的生物学过程,高危组显著富集“成纤维细胞增殖的正调节”,但没有任何免疫相关的生物学过程(图 6E),这个结果与之前的结果惊人地一致。PD-L1 和 PD-L2在两个免疫相关的生物学过程中都有注释,表明 PD-L1 和 PD-L2 可能调节低风险组的免疫状态(图 6F)。来自 TCGA 的队列中的 mRNA 表达水平分析发现,低风险组中 PD-L1 和 PD-L2 的 mRNA 表达显著增高(图 6G),与 CNV 数据一致。这一发现表明,肿瘤中的 CNV 有助于观察到免疫浸润的差异。
在这篇工作中,整合了多套公共数据结合PSM、LASSO、单因素COX和多因素COX算法构建风险评分,并在大样本数据集中进行验证,解析了高低风险组中的外在和内在免疫景观,分析高低风险组的CNV特征。基于突变的数据进行检测时不容易受技术手段的影响,在今后的工作中使用突变数据分析为临床转化提供更大的便利,纯生信分析也可以助力临床转化,感兴趣的小伙伴千万不要错过呀!