肿瘤分型对于恶性肿瘤生物学行为和预后评估至关重要,同时也有助于个体化治疗,因此一直是肿瘤研究的一个热点方向。在分型研究中,选好关注角度,对后续研究,以及结果刻画至关重要。生信人也介绍了多个肿瘤分型相关的文章及思路,小编今天就再和大家分享一篇今年7月8日刚刚发表在Genome Medicine(IF:15.266)杂志上的关于肺鳞癌分型与免疫治疗的文章。文章采用的分型方法是经典的非负矩阵分解(NMF),但关注了免疫治疗耐药性,并结合多组学数据,使文章思路新颖,内容丰富。做分型的小伙伴一定不要错过这篇文章呀。
Identifcation of a cytokine-dominated immunosuppressive class in squamous cell lung carcinoma with implications for immunotherapy resistance
识别鳞状细胞肺癌中以细胞因子为主的免疫抑制类与免疫治疗耐药性的关系
一.研究背景
肺癌是世界范围内最常见的癌症,也是癌症相关死亡的主要原因。其中非小细胞肺癌(Non-smallcell lung cancer, NSCLC)约占肺癌患者的85%。除肺腺癌外,肺鳞癌(lung squamous carcinoma, LUSC)是NSCLC最常见的组织学亚型。目前免疫检查点阻断(ICB)疗法显著改善了肺鳞癌(LUSC)的治疗。然而,仍然存在相当一部分高PD-L1表达患者对免疫检查点抑制剂具有耐药性。因此,进一步了解潜在的耐药机制,刻画免疫抑制肿瘤微环境和识别生物标志物对预测患者耐药来说十分有必要。
二.文章摘要
该研究对624例LUSC样本的RNA测序数据进行了分析。作者通过无监督聚类分析肿瘤微环境中的基因表达模式,并将表达模式与一组T细胞耗竭特征、免疫抑制细胞、临床特征和免疫治疗反应联系起来。使用内部和外部测试数据集来验证耗竭免疫状态的存在。结果观察到大约28 - 36%的LUSC患者表现出显著的T细胞耗竭特征富集、免疫抑制细胞比例高、抑制检查点的共同上调,以及抗炎细胞因子的表达增强。作者将这一免疫抑制组患者定义为耗竭免疫类(EIC),作者也观察到EIC表现出肿瘤浸润淋巴细胞密度高,与不良预后相关的特征,且尽管EIC PD-L1表达相对升高,但对ICB治疗有潜在的耐药性。作者也开发了一个web应用程序,以便研究人员根据多组学分析数据进一步探索ICB耐药性的潜在关联。
三.数据及方法
1. LUSC数据集和资源:作者从TCGA(497个RNA测序[RNAseq]数据集)和GEO(127个芯片数据集)中检索到624个人类LUSC样本的基因表达谱。由于肿瘤分期的不同会影响临床特征和治疗方案,因此作者将497例TCGA LUSC患者分为晚期组(IIA - IV期,250例患者)进行训练和早期组(i - II期,247例患者)进行内部验证。其他突变、拷贝数变异、甲基化、临床病理等相关数据也均从TCGA获取。同时作者对蛋白编码基因数据进行NMF分析。另外来自GEO的两个独立数据集用作外部验证。作者也从GEO数据库获取28例黑色素瘤患者样本(GSE78220)经抗PD -1治疗后的临床结果和基因表达情况数据,并基于irRECIST识别应答模式。
2. 无监督聚类识别耗竭免疫类:作者基于250名训练队列的样本的RNA-seq数据使用非负矩阵分解(NMF)进行分析。作者也通过单样本基因集富集分析(ssGSEA)计算免疫和基质富集评分来揭示免疫和基质相关的表达模式。接着作者将免疫和基质富集分数与NMF识别的簇结合,观察到,与其他簇相比簇2具有更高的富集分数,因此,作者将第2类称为“免疫基质类”。接下来作者分析了免疫基质簇肿瘤中特异性免疫细胞的丰度,并收集了许多代表各种免疫细胞的特征,用于ssGSEA计算富集分数。然后将免疫细胞的富集分数与簇结合,以确定免疫基质簇中特异性免疫细胞的丰度。另外,作者也从TIMER数据库中下载了基于基因表达谱的CIBERSORT算法推断的22个浸润免疫细胞数据。此外,作者从先前研究中下载了样本的白细胞分数及肿瘤浸润淋巴细胞(TIL)百分数。然后,作者提取TCGA LUSC患者22类浸润免疫细胞的分数、白细胞分数和TIL百分比,比较免疫基质簇与其余簇之间的差异。最后,作者对多个抑制受体进行表达谱分析,并对代表T细胞耗竭的基因特征进行ssGSEA评分,结果观察到免疫基质簇过表达多个抑制受体,并具有高T细胞耗竭相关的特征富集分数。因此,作者将免疫基质簇群体定义为耗竭免疫类别(EIC),其余群体定义为剩余类别,并使用NMF包装的extractFeature方法提取相关基因(宏基因特异性基因)来刻画EIC的表达模式。
3. 耗竭免疫类的分子特征:作者采用GSEA和ssGSEA分析EIC中分子通路的富集情况和基因表达特征。作者从MSigDB获取hallmark基因集和KEGG通路特征,并利用Cytoscape插件ClueGO生成KEGG通路的功能分组网络来分析宏基因特异性基因的生物学作用。接着为识别EIC组和其他组的差异表达基因,作者采用DESeq2进行基因差异表达分析,并在宏基因特异性基因中,将EIC与其他类之间的差异表达基因定义为TCGA训练队列中用于识别EIC的耗竭免疫分类基因,同时使用GSEA识别EIC中富集的激活通路和hallmark基因集。
4. EIC的早期TCGA LUSC内部验证:作者为了证实早期LUSC中存在免疫衰竭状态,使用上述方法对247个早期样本的表达谱进行了NMF和ssGSEA分析。同样,也获得了4个早期LUSC簇。当整合早期样本中用于晚期LUSC队列的特征富集分数时,作者观察到簇2具有更高的免疫细胞、基质和TEX相关的特征富集分数。因此,簇2在早期被识别为早期LUSC的EIC。作者同样比较EIC组与其他组的免疫细胞比例、白细胞比例、TIL比例和多重抑制受体表达,并通过GSEA识别hallmark富集和KEGG通路。此外,作者使用ssGSEA计算训练阶段获得的167个耗竭免疫分类基因的富集分数,定义为EIC分数,并采用ROC分析评价其预测能力。
5. EIC的ICB治疗预测:作者用TIDE算法预测潜在的ICB治疗反应。作者还分析了黑素瘤肿瘤表达的公开数据和使用抗PD-1治疗的患者的临床结果,来验证ICB治疗耐药性与167个耗竭的免疫分类基因之间的关联,即利用167个耗竭免疫分类基因,通过ssGSEA计算黑色素瘤肿瘤样本的EIC评分,并比较应答者和无应答者。
6. EIC的基因组突变、染色体变异和甲基化分析:作者采用Maftools对体细胞突变进行分析,并统计体细胞突变总数,还从先前研究获取LUSC患者新抗原的统计信息。作者从cBioPortal for Cancer Genomics数据库中获取GISTIC2.0生成的TCGA LUSC样本拷贝数数据。然后,作者评估了EIC与其他类在体细胞突变、新抗原数量和拷贝数变化方面的差异。此外,作者也使用limma包识别EIC和其他类别之间差异甲基化的显著CpG位点。最后,计算了启动子区域甲基化水平与相应基因表达的相关性。
7. EIC的独立数据集验证:作者利用无监督随机森林方法评估免疫分类基因的鲁棒性。基于这些基因的表达值,使用randomForest R包对训练队列进行了无监督学习,然后利用NMF在另外两个数据集上验证了耗竭免疫分类基因预测耗竭免疫状态的能力。
8. 高度可视化的交互式web应用程序:基于研究的分析数据,作者使用R中的' shiny '构建了一个交互式的web应用程序,以供其他研究者在多组学水平上探索免疫治疗耐药性的潜在机制。web应用程序包括几个免疫治疗耐药相关分析模块,如耗竭免疫分类模块、特征表达模块、体细胞突变模块、临床预后模块、microRNA模块和甲基化模块。
9. 蛋白表达分析:作者为研究EIC蛋白表达的变化,从TCGA下载了319例LUSC患者的蛋白表达数据,来比较EIC组与其余组的蛋白表达。此外,作者通过Human protein Atlas的病理切片探索了蛋白的表达。
四.研究的主要内容与结果
1. 识别及刻画晚期LUSC的耗竭免疫类
在文章的第一部分,作者对训练队列中250个晚期LUSC样本进行了NMF分析,训练队列的数据集被分为四个表达簇(图1A)。作者通过ssGSEA计算发现簇2的LUSC患者具有较高的免疫和基质富集分数,表明免疫细胞和基质成分基因表达特征显著富集,作者将这一簇命名为免疫基质簇(Fig. 1B),作者发现免疫基质簇具有显著富集的免疫细胞特征(图1C)。接下来,作者为了进一步验证这些免疫细胞在免疫基质簇中的富集,比较了CIBERSORT估算的免疫细胞在免疫基质簇和其他簇之间的绝对比例。结果发现与ssGSEA富集分析一致(图1D)。此外,作者也观察到免疫基质簇中DNA甲基化评估的白细胞比例明显高于其他簇(图1E)。同样,作者通过病理图像评估的肿瘤浸润淋巴细胞(TILs)发现在免疫基质簇中明显高于其他簇(图1F)。接下来为了探索LUSC中的TEX,作者对多种抑制受体进行了表达谱分析,结果发现这些抑制受体在免疫基质簇的样本中显著上调(图1G),且免疫基质簇的患者也表现出了多个基因集的显著富集(图1H)。基于上述抑制受体的表达分析和TEX信号基因集的富集得分,作者识别出了一个新的群体亚群,属于免疫基质群,占训练队列的36.4%,并称为耗竭免疫类(EIC)(图1H)。作者将训练队列中的剩余亚群定义为剩余类。为了进一步验证EIC的T细胞耗竭,作者收集了三种参与TEX调控的免疫抑制细胞类型(NK细胞、巨噬细胞和CD4_Treg_cells)的3个基因特征,以及促进TEX的细胞因子的4组hallmark基因(图1H),印证EIC的免疫抑制TME。以上结果表明,作者识别出了一个耗竭的免疫类群,该免疫类群在TME中显著富集了耗竭的T细胞和其他免疫抑制细胞的基因表达特征。
2. 细胞因子富集是EIC特有的分子特征
在这一部分,作者为了刻画EIC的分子特征,在训练队列使用基因集富集分析(GESA)识别了KEGG通路和hallmark基因集在EIC中富集情况,结果观察到细胞因子相关的通路和hallmark在EIC中显著富集(图1I)。作者使用ClueGO将NMF提取的253个代表EIC表达模式的宏基因特异性基因分组成KEGG通路网络,进一步揭示它们的分子功能(图1J)。 上述分子功能刻画表明,细胞因子相关的表达信号在LUSC的耗竭免疫状态中起主导作用。
3. EIC的早期TCGA LUSC内部验证
在这一部分作者为了验证早期LUSC是否存在耗竭的免疫类,对另外247个TCGA早期LUSC样本进行了NMF,获得了4个簇(图2A),并通过ssGSEA分析观察到簇2的基质和免疫富集分数高于其他簇(图2B)。此外,簇2还表现出与TEX相关的免疫细胞基因表达特征和其他细胞因子hallmark的显著富集(图2B)。因此,在TCGA早期LUSC样本中,作者将簇2定义为耗竭的免疫类。作者也观察到与LUSC晚期EIC相一致的是,早期LUSC 的EIC中CIBERSORT评估的的浸润免疫细胞、白细胞及肿瘤浸润淋巴细胞的比例都较高(图2C-E)。作者也在早期LUSC的EIC中观察到多个抑制受体共同上调(图2F)。不过在早期LUSC的 EIC中未观察到凋亡hallmark的富集,这表明早期LUSC的EIC的TEX水平低于晚期。此外,ROC曲线(图2H)也表明耗竭免疫分类基因对EIC具有良好的预测性能。
4. EIC在LUSC晚期预后较差
在这一部分作者通过与临床病理变量相关的分类来研究耗竭免疫状态的预后价值。结果发现在晚期和早期LUSC的EIC中TILs的比例均高于其余类(图1F和2E),不过LUSC晚期的Kaplan-Meier分析表明EIC患者的OS和PFS明显较差(图3A,D),且Cox多因素分析也显示EIC仍是LUSC晚期OS的独立预后因素(图3G)。作者也发现对于早期LUSC, EIC组与其他组的OS和PFS均无差异(图3 B,E)。最后,作者分析了所有阶段LUSC患者的预后价值发现EIC患者的OS和PFS比其他类更差(图3 C,F)。这些结果证实,虽然EIC中存在大量的T细胞,但大部分T细胞处于免疫抑制状态,失去了控制肿瘤进展的效应细胞功能,导致预后较差。
5. EIC与免疫治疗抵抗有关
在这一部分,作者为了研究EIC对ICB治疗的反应,比较了EIC和其余类患者的PD-L1表达,发现在早期和晚期LUSC中,EIC的PD-L1表达水平均高于其余类患者(图4A,B)。作者还使用TIDE算法来预测ICB治疗反应,结果观察到在早期和晚期LUSC中,EIC的TIDE预测得分都高于其他类别(图4A,B)。TIDE预测得分越高,ICB反应越差,这些结果表明,虽然EIC患者有高PD - L1表达,但他们可能对ICB治疗有耐药性。作者为了进一步验证EIC的免疫治疗耐药性,计算了28例经抗PD-1治疗的转移性黑色素瘤患者和497例TCGA所有肿瘤分期的LUSC患者的167个耗竭免疫分类基因的富集评分。结果发现对ICB治疗无反应的黑色素瘤患者比对ICB治疗有反应的黑色素瘤患者有更高的富集分数(图4C)。且EIC内的患者也显示出比其他组更高的富集分数,进一步证明了EIC的耐药性(图4D)。作者也观察到TGFB1在EIC中的表达水平高于其他类(图4E)。
6. EIC具有独特的甲基化模式
在这一部分作者为了探索EIC中与调控基因相关的表观遗传改变,对所有肿瘤分期的TCGA队列进行了全基因组甲基化分析,发现与其他类型相比,EIC中位于162个免疫相关基因启动子区域的216个CpG位点发生了差异甲基化(图5A,B)。作者也观察到,与其他类相比,ARTN的启动子区甲基化水平更高,EIC的基因表达水平更低,相反,转录因子SMAD7在EIC中甲基化水平较低,表达较高(图5C-E)。
7. EIC在肿瘤突变负荷或新抗原数量上没有差异但在拷贝数负荷上有改变
肿瘤的基因组突变与免疫治疗结果密切相关,因此在这一部分作者描绘了在晚期和早期LUSC的EIC和其他类之间的基因突变景观。结果发现EIC组与其他组个体基因突变无显著差异(图6A,D)。作者还将体细胞突变负荷和突变的新抗原与LUSC的耗竭免疫状态联系起来,结果也没有观察到显著改变(图6B-E)。作者进一步研究了EIC评分与TMB之间的相关性,结果如图6G所示,EIC评分和TMB之间没有显著的相关性,表明EIC评分可独立预测免疫治疗耐药性。另一方面,作者也发现EIC样本有较低的拷贝数改变负荷(图6 H-O)。
8. 新耗竭免疫类在两个独立数据集上的外部验证
作者在这一部分为了验证LUSC样本训练队列中存在耗竭免疫状态,使用167个耗竭的免疫分类基因,在另外两个独立的测试数据集中估计了免疫分类基因预测免疫耗竭状态的能力。结果发现与训练队列相似,大约30-35%的LUSC样本在测试数据集中被识别为EIC。接着作者基于基因表达谱,对测试数据进行分子识别,也证实EIC具有较高的免疫和基质富集得分。
9. EIC中IDO蛋白表达较高
在文章的最后一部分,作者利用LUSC的RPPA数据研究EIC与其他类的蛋白表达差异。结果观察到早期和晚期LUSC的EIC中PD-L1和IDO蛋白的表达均高于其他类(图7A,B)。由于在选择NSCLC患者进行抗PD -1抑制剂治疗时,会采用免疫组化的方法来评估PD-L1蛋白的表达。因此,作者研究了不同的IDO蛋白表达HPA免疫组化染色的LUSC患者组织图像,结果观察到LUSC患者IDO免疫组化表达量不同(图7C)。这些证据表明,在LUSC患者的转录组、蛋白组和染色组织中IDO的表达水平存在差异,表明IDO免疫组化表达可能是PD-L1高表达的LUSC免疫治疗耐药的潜在生物标志物。
到这里这篇文章的主要内容就介绍完了,文章整合多个平台的多组学数据,采用非负矩阵分解的方法识别了LUSC患者中的免疫抑制类,并分析了其与ICB治疗的潜在耐药性关联,同时对这一免疫抑制类从表达、功能、表观等多个层面进行了分析。文章的核心方法包括非负矩阵分解及ssGSEA等经典的生物信息方法,数据也来自公共数据库,这一篇公共数据库的纯生信分型文章能发到15+,小编认为其亮点在于内容丰富、逻辑清晰、关注热点。