在癌症相关的研究中,预后分析是主要研究角度之一,也以一个热点发文方向。生信人也推出过很多关于建立预后模型的文章,其中包括热点的铁死亡预后模型、自噬预后模型、缺氧预后模型、免疫相关预后模型等。这些文章多数都以相关基因为焦点,构建预后模型,今天小编再和大家分享一篇今年六月刚刚发表在Frontiers in Immunology(IF:8.786)杂志上的关于肝癌免疫相关预后的纯生信文章。文章主要方法包括差异表达、单因素及多因素cox分析、LASSO分析及功能富集分析等经典的生物信息方法。然而,不同于多数预后分析,文章在细胞的水平构建预后模型思路比较新颖,同时结合了单细胞水平的分析起到了锦上添花的效果。文章方法不难,但研究角度很好,感兴趣的小伙伴不要错过呀。
Identification of the Immune Subtype of Hepatocellular Carcinoma for the Prediction of Disease-Free Survival Time and Prevention of Recurrence by Integrated Analysis of Bulk- and Single-Cell RNA Sequencing Data
整合组织和单细胞数据识别能够预测肝癌无病生存期和预防复发的免疫亚型
一.研究背景
肝癌是导致癌症相关死亡的第三大原因,也是全球男性癌症相关死亡的第二大原因,其中肝癌最常见的形势就是肝细胞癌(HCC)。尽管近年来肝癌的治疗取得了很大的进展,但由于缺乏早期诊断标志物、手术后早期复发、化疗或分子靶向治疗耐药等问题的存在,肝癌的预后仍不理想,且现有的治疗方法对晚期HCC患者的治疗效果非常有限。因此,识别敏感的早期诊断标志物和无病生存(DFS)期的预测因子,以及预防复发的可靠靶点就显得尤为重要,这将极大地改善HCC患者的DFS时间和临床结局。
二.文章摘要
该研究采用单样本基因集富集分析(ssGSEA)评估HCC样本中的免疫细胞丰度,同时采用LASSO及单因素和多因素Cox分析评估免疫细胞对DFS时间预测的预后价值。然后,根据最具预后性的免疫细胞及其相应系数构建风险评分。通过单细胞RNA (scRNA)测序数据和CellMiner进一步识别了具有预后作用的免疫细胞和预防复发的特定靶点之间的相互作用。最终基于三种最具预后价值的免疫细胞类型的数据,构建了一种效应T细胞风险评分(TCRS),用于识别DFS时间更长和具有炎症免疫特征的HCC患者免疫亚型。文章也明确TCRS得分高、低组之间的功能差异,并阐明了免疫细胞之间的细胞通讯。此外,文章也识别了15个预防复发的潜在治疗靶点。
三.数据及方法
1. 数据收集及处理:作者从TCGA数据库下载了371例原发性HCC患者的生存信息和基因表达数据。此外,从NODE数据库中下载了159例HCC患者的基因表达数据和生存信息作为验证队列1,作者也从GEO数据库中下载了包括242例HCC患者表达数据的数据集GSE14520作为验证队列2。研究将术后随访复发的患者定义为复发,反之定义为无病,将手术到疾病复发或最后一次随访的时间定义为DFS时间。
2. TCRS的构建与评估:文章使用ESTIMATE计算HCC样本的免疫评分、ESTIMATE评分、基质评分和肿瘤纯度,用单样本基因集富集分析(ssGSEA)方法计算HCC样本中28个免疫细胞的丰度。接下来,作者使用LASSO和单因素及多因素Cox分析评估这28个免疫细胞对预测DFS的预后价值。最终基于最具预后价值的免疫细胞构建了效应T细胞风险评分(TCRS),并根据ggrisk包中roc方法计算TCRS的最优截断值,将各队列HCC患者分为高、低评分组,进而比较两组患者的生存和免疫状况。
3. GSVA和差异分析:作者在训练队列中,使用GSVA初步识别了高低分组之间的差异。然后,使用DESeq2识别高低分组之间的差异表达基因。随后作者对差异基因进行GO及KEGG富集分析。
4. HCC患者的单细胞分析:研究共纳入了12例原发性以及6例早期复发的HCC样本的scRNA测序数据,作者分析了数据提供者注释的T细胞簇的表达数据,并对数据进行了标准化和高变异基因的识别,在主成分分析(PCA)之后,利用UMAP分析进行降维。之后,通过“FindNeighbors”和“FindClusters”函数确定了15个T细胞亚群,每个亚群的显著差异基因(DEGs)由“FindAllMarkers”函数识别。随后,作者进行了细胞类型注释,并使用CellChat确定细胞类型间通信。最后使用“Findmarker”方法检测原发性肝癌细胞和复发肝癌细胞中相同类型免疫细胞的DEGs。
5. 评估scRNA数据识别DEGs的预后和免疫价值:文章采用单因素和多因素Cox分析免疫细胞间DEGs的预后价值,并使用LASSO进一步筛选。通过多变量Cox分析系数计算出基因风险评分(GRS)。训练队列中的HCC患者也根据“ggrisk”包中的“roc”法计算出GRS的最佳临界值,将患者分为高、低评分组,比较两组患者的生存和免疫状况。最后,利用基于NCI-60细胞系的工具CellMiner筛选这些基因的潜在预防复发药物。
四.研究的主要内容及结果
1. TCRS的构建与评价
在文章的第一部分作者首先介绍了研究的总体流程如图1所示,接着作者经LASSO筛选及单因素和多因素Cox分析后(图2A、B和表1),构建TCRS,并展示了高低得分组间的分组信息,效应记忆CD8 T细胞,调节性T细胞及辅助滤泡T细胞的丰度、DFS状态(图2C)。作者分析发现低评分组患者的DFS时间明显长于高评分组(图2C, D),同时作者计算了1年、3年和5年ROC。接下来,作者分析了两组之间的免疫特征,结果发现低评分组的免疫评分、ESTIMATE评分和基质评分显著高于高评分组(图2E-G),而高评分组的肿瘤纯度显著高(图2H)。此外,作者也观察到28个免疫细胞的表达水平在低评分组中明显升高(图2I, J),并将其确定为DFS时间较长、具有炎症免疫特征的HCC免疫亚型。
2. TCRS效果的外部验证
在文章的第二部分作者为了进一步验证TCRS的有效性,对两个验证队列进行了分析。首先使用ssGSEA计算了28个免疫细胞的丰度,接着计算了TCRS,计算公式与训练队列相同。然后,根据两个验证队列中TCRS的最佳临界值,将HCC患者分为高分和低分组,并展示了两组间的分组信息、DFS状态以及效应记忆CD8 T细胞、调节性T细胞和辅助性T细胞的丰度(图3A)。作者同样发现在两个验证队列中,低评分组患者的DFS时间明显长于高评分组(图3B)。其次,作者也发现验证队列中低得分组的免疫评分、ESTIMATE评分和基质评分显著高于高得分组(图3C-E),而高分组肿瘤纯度明显更高(图3F)。此外,28个免疫细胞中大部分在低评分组也明显高(图3G, H),这些结果表明TCRS可以很好地识别HCC的免疫亚型,用于预测DFS时间。
3. TCRS分组间的差异分析
接下来作者为了明确高分组和低分组之间的功能差异,在训练队列中进行了差异分析。首先,通过GSVA来刻画总体差异,如图4A所示,差异最大的前10条功能通路多数与免疫相关,如自身免疫性疾病、IgA产生的肠道免疫网络、抗原加工和呈递等。接下来,作者通过火山图(图4B)对两组之间的DEGs进行可视化,并选择显著的DEGs进行进一步的GO和KEGG分析,结果发现这些基因也显著富集到与免疫相关的功能与通路中(图4C,D)。这些结果初步确定了TCRS划分的HCC患者风险评分组之间的功能差异,这些差异可能是延长DFS时间的潜在干预靶点。
4. 通过scRNA数据识别预防肝癌复发的特异靶点
作者在这一部分为了系统评估三种预后免疫细胞在HCC复发中的协同作用,对scRNA测序数据进行了分析。由于用于构建TCRS的免疫细胞均为T细胞,因此研究分析了原发性HCC中的5415个T细胞和复发HCC中的1879个T细胞,并识别出15个T细胞簇通过heatmap 显示每个簇中最显著的前5个DEG(图5A, B)。接下来,根据marker基因(图5C-E),将这些T细胞簇标记为三种细胞类型(效应记忆CD8 T细胞、滤泡辅助及调节性T细胞和其他细胞),并通过小提琴图(图5F)显示每种细胞类型的特异性基因。不同T细胞亚群在每个样本或不同肿瘤类型中的比例如图5G所示。接着为了进一步阐明这些免疫细胞的整合作用,作者进行了细胞-细胞通信分析。这些细胞类型之间的相互作用如图6A-B所示。此外,作者进一步研究了这三种细胞类型之间潜在信号,以及具体的分子对。结果如图6C所示,可以观察到效应记忆CD8 T细胞是主要的信号提供者,滤泡辅助及调节性T细胞是主要的信号受体。随后,作者研究了这些细胞类型之间的具体信号对(图6D, E)。这些结果初步阐明了这些细胞类型之间潜在的相互作用,有助于进一步研究效应记忆CD8 T细胞、调节性T细胞和滤泡辅助T细胞在预测DFS时间和预防HCC复发中的综合作用。
5. 识别预防复发的特定靶点
在文章的最后一部分,作者为了进一步筛选可能与HCC复发相关的预后免疫细胞中的关键基因,利用scRNA数据识别原发性和复发性HCC之间的DEGs,结果在效应记忆CD8 T细胞和滤泡辅助及调节性T细胞中分别筛选出298和407个DEG,通过整合最终得到645个基因用于后续分。这些基因经cox及LASSO分析(图7A, B),识别出15个预后基因,作者观察到它们中大多数在高TCRS组中高表达。接下来,作者根据这15个预后相关基因的表达水平及其相关系数构建GRS ,并利用GRS的最优截断值定义这15个关键基因在高分组和低分组中的分群信息、DFS状态和表达水平,生存分析结果也显示,低评分组患者的DFS时间明显长于高评分组(图7C, D)。此外,作者分析免疫结果发现低GRS组也被识别为DFS时间较长、具有炎症免疫特征的免疫亚型,这与TCRS的结果一致(图7 E-J)。这些结果表明,这15个关键基因可能与免疫细胞影响DFS时间的过程有关,也可能是预防HCC复发的潜在靶点。最后,作者通过CellMiner初步筛选潜在的预防复发药物如图8所示。
到这里这篇文章的主要内容就介绍完了,文章结合组织及单细胞数据构建并验证了一个预测肝癌术后DFS时间的模型。同时还识别出15个关键基因作为预防复发的候选基因,并对这些基因的潜在药物进行了研究。有别于其他聚焦基因水平的预后文章,该研究以免疫细胞丰度为关注点,进行预后及分型分析,这种切入点也更容易结合单细胞数据进行更细致的解析刻画,小编觉得是一个不错的学习思路。