大家好呀,今天让我们来看一篇如何通过整合bulk数据和single-cell数据来解释肝癌的肿瘤异质性及其免疫抑制机制,文章于今年六月发表在《Molecular Oncology》(IF = 7.449)上,让我们来一起学习一下吧!
肝细胞癌 (HCC) 是最常见的原发性肝癌。由于肿瘤异质性,肝癌治疗中出现耐药性是不可避免的。为了提高免疫治疗的疗效,我们应进一步研究不同亚型患者免疫细胞的异质性,并确定合适的患者进行特异性免疫治疗。研究肿瘤抑制的机制,从而丰富免疫治疗的疗效。近年来,单细胞RNA测序 (scRNA-seq) 已成为揭示肿瘤免疫微环境中细胞异质性的有力工具。在这项研究中,作者整合了scRNA-seq和多组学数据的分析,揭示了肝癌的肿瘤间和肿瘤内的异质性及其免疫抑制机制。该发现有助于临床诊断,丰富肝癌免疫治疗。
作者首先通过NMF聚类方法将患者分为的三个亚型,并分析其肿瘤间异质性,包括免疫浸润状态和突变谱。将S1亚型定义为具有高免疫浸润评分的 “hot tumors”,将S2定义为具有高肿瘤纯度评分的 “cold tumors”,将S3定义为具有高水平免疫抑制评分的 “immunosuppressed tumors”。
然后,作者使用来自三种HCC亚型的差异基因将大量RNA数据与scRNA-seq数据整合构建了一个基于108个基因的基因分类器。scRNA-seq样品也可以使用108基因分类器被分成相应的HCC亚型 (S1-CS1、S2-CS2、S3-CS3)。
随后,三种亚型的肿瘤内异质性被研究。值得注意的是,由于亚型三具有最差的预后,作者分析其免疫抑制的调控机制,发现转录因子BATF可以促进CTLA4和TIGIT等免疫抑制基因的表达水平,并且在BATF敲除细胞系数据和其他两个单细胞数据集中对BATF进行了验证,证明了BATF可以促进免疫抑制基因并诱导HCC的不良临床预后。
1、使用非负矩阵分解(NMF)方法确定了HCC中存在三个子类型
对来自TCGA数据库中的353例转录组数据,利用非负矩阵分解(NMF)算法的共识聚类确定了3个不同亚型(如图1B),其中模式S1聚类120例,S2聚类144例,S3聚类89例。并在ICGC队列中验证了聚类结果。有趣的是,发现S3患者在三种亚型中预后最差。同时,三种亚型的临床指标差异分析显示S3患者的肿瘤分期明显升高,这可能是该亚型预后不良的部分原因。
2、HCC的肿瘤间微环境(TME)异质性分析
作者利用ESTIMATE算法评估三个亚型免疫浸润和肿瘤纯度的异质性,发现S2的免疫评分低,但是肿瘤纯度高(图2A);并通过CIBERSORT计算三个亚型22种免疫细胞的浸润比例,发现三个亚型之间浸润的活化免疫细胞存在差异(图2B)。通过对三个亚型免疫细胞抑制基因评分的比较发现S3免疫抑制基因高表达,比较亚型T细胞的标记基因(图2C)、免疫抑制评分和生存预后结果,免疫抑制T细胞基因高评分可能和不良预后相关。 还通过GSVA对三种亚型进行GO_BP和HALLMARKER进行富集分析来研究亚型之间的功能特征,结果显示,免疫相关通路(如IL6-STAT3和T cell selection)在S1和S3中富集,而CD4激活、炎症反应和T细胞分化通路在S1中富集。此外,与S2中脂肪酸、脂质代谢和氧化磷酸化水平相比,S3中B细胞凋亡和WNT通路的富集分数更高(图2D)。综上所述,S2具有较低的免疫浸润率,显示“cold tumors”特征,S1具有“hot tumors”特征,而S3具有高表达的免疫抑制基因特征,显示“immunosuppressed tumors”特征。
为了研究突变和肿瘤免疫相关性,本文分析了HCC亚型之间的体细胞突变和拷贝数变异(CNV)的频率差异以及不同亚型的特异性突变特征。具体来说,S2的钙粘蛋白相关蛋白beta 1(CTNNB1)和ARID1A突变频率显著高于S1和S3。与S1和S2相比,S3中TP53和BAP1的突变频率更高。BAP1调控细胞死亡和线粒体代谢,这与S3中耗竭标记基因的高表达水平相一致(图3A)。三种亚型的CNV谱均存在显著的异质性。S1扩增的变异样本最多,而S2缺失的变异样本最多(图3B)。S1、S2和S3三个亚型CNV突变区域也存在差异(图3C)。根据每个亚型之间基因表达、缺失和扩增得出以下结论,BAP1的高突变、YEATS4和VIMP的扩增以及CYFIP2和ABLIM3的缺失可能诱导S3的免疫抑制环境,而CTNNB1的高突变可能抑制S2的免疫浸润。
3、一种通过整合bulk和single-cell转录组数据的新型基因分类器
为了整合scRNA-seq数据和bulk数据,作者将GSE149614 scRNA-seq数据集中的10个样本根据基因平均表达值整合成bulk数据。使用免疫浸润和肿瘤纯度估计计算免疫抑制、活化T细胞(aT)和liver scores。同时,评估了10个样本的免疫和肿瘤纯度评分。根据算得的评分将10个样本分类:HCC02T、HCC03T、HCC04T和HCC05T为“cold tumor”(图4A);HCC08T、HCC09T和HCC10T“immunosuppressed tumor”(图4B);HCC01T、HCC06T和HCC07T为“hot tumor”(图4C)。接下来,作者通过选择与亚型相关的基因建立分类器识别上述参考集中的所有阳性样本。使用从三个亚型(S1、S2和S3)的差异表达基因对参考集进行了分类分析,结果显示,当选择前108个基因构建分类器时,所有假阳性率(FPRs)均为0且所有真阳性率(TPRs)均为1(图4d)。总而言之,这108个基因作为特征可以很好地将样本分成我们预期的三个亚型。
4、三个HCC亚型之间的TME异质性
作者对三个单细胞亚型(CS1,CS2,CS3)在细胞水平上进行肿瘤微环境(TME)异质性评估。结果发现,CS3的免疫和免疫抑制评分最高,CS2的肿瘤纯度和liver score最高(图5A)。根据细胞谱系特异性标记基因进行基因表达归一化、降维、聚类和表征,将这些细胞分为16种类型,通过marker gene进行注释(图5B,C)。然后,使用基因集变异分析(GSVA)的免疫基因集对免疫细胞进行分类。在T细胞和NK细胞中,mT是一种(高表达IL7R、CCR7和CD69)记忆T细胞,在幼稚T或mT信号中富集。tT是一种(高表达HAVCR2、TIGIT、BATF和CTLA4)免疫抑制T细胞类型 (图5D,E)。总而言之,在三个单细胞亚型中免疫细胞的占比结果显示,CS1亚型NK和aT细胞占比多,CS3亚型mT、mB、tT、mMφ、myCAF细胞占比多,CS3亚型上皮细胞(H1、H2、H3、H4)细胞占比多,进一步验证了基因分类器的分类效果(图5F)。
5、转录因子BATF以及MDSC样巨噬细胞可促进免疫抑制细胞的形成
由于CS3(single-cell)和S3(TCGA)两个亚型都有着相似的免疫抑制的调控机制,所以本文分析促进该亚型中免疫抑制T细胞形成的调节机制和细胞间的相互作用。首先,本文利用WGCNA计算CS3特异性亚型(mT、tT、myCAF和mMφ)相关的基因模块(图6A),得到12个显著相关的基因模块。每个模块的关键基因构建共表达网络,mT hub基因在T细胞选择和T细胞分化途径中富集,而tT hub基因负调控T细胞活化以及白细胞介素10的分泌(图6B)。然后,将WGCNA与SCENIC计算的TF结果结合,选择tT hub基因和TF调控显著的结果,从而挖掘关键的免疫抑制促进的转录因子(TF)。值得注意的是:转录因子BATF可以调控TIGIT、CTLA4和共刺激基因ICOS(图6C)。进一步的验证也证明了这些基因对之间存在明显的共存现象(图6D)。并发现BATF的高表达与不良预后相关(图6E),将Treg细胞上BATF敲除的GSE149197基因表达数据显示,BATF、CTLA4、TIGIT和FOXP3的表达显著降低(图6F),这说明转录因子BATF可以通过上调免疫抑制基因的表达,在免疫抑制细胞的形成中发挥关键作用。
由于S3亚型具有较高的基质得分,作者分析了肿瘤微环境细胞在肿瘤免疫抑制微环境形成中的作用。细胞相互作用结果显示,tT中的细胞可以通过趋化因子CXCL12_CXCR4、CCL4_CCR5和CCL3_CCR1与CS3特异性的mMφ相互作用。mMφ的特征是过表达免疫抑制基因IL10,并可以通过NECTIN2_TIGIT与tT相互作用。tT可以进一步抑制T细胞的免疫应答,最终促进HCC中免疫抑制环境的产生。此外,mMφ通过CXCL12_CXCR4和生长因子VEGFA_FLT1等趋化因子与myCAF和内皮细胞相互作用(图6G)。同时,endothelial (End)中的内皮细胞也可以通过TIGIT_PVR与tT相互作用,这也可能促进免疫抑制细胞的形成。因此,mMφ可以直接或间接地促进HCC的S3样亚型的免疫抑制状态。
作者通过对HCC bulk数据聚类分析,识别出三个亚型(S1,S2,S3),并且通过免疫评分、基质评分、生存率、CNV对三个亚型进行了异质性分析并得出了很好的结果。发现免疫抑制亚型S3和不良预后相关。接下来对单细胞数据取均值模拟bulk数据,使用bulk数据构建的将HCC的single-cell数据分成CS1、CS2和CS3三个亚型,凭借这样的方法将bulk数据和single-cell数据很好的结合在一起,发现了TF BATF可以通过上调免疫抑制基因的表达,在免疫抑制细胞的形成中发挥关键作用,并通过细胞之间的互作发现了S3肿瘤免疫抑制微环境形成的原因。我们可以从本文中学习到亚型分析的常规方法以及如何连接bulk数据、single-cell数据。随着single-cell技术迅速的发展,它可以让我们对疾病在细胞有更好的解析,但是bulk数据常常具有更大的样本量、包含更多的表型信息,所以将单细胞数据和bulk数据结合分析亚型也是很值得我们学习的。
参考文献:
Wang T, Dang N, Tang G, Li Z, Li X, Shi B, Xu Z, Li L, Yang X, Xu C, Ye K. Integrating bulk and single-cell RNA sequencing reveals cellular heterogeneity and immune infiltration in hepatocellular carcinoma. Mol Oncol. 2022 Jun;16(11):2195-2213. doi: 10.1002/1878-0261.13190 . Epub 2022 Mar 1. PMID: 35124891 ; PMCID: PMC9168757 .