哈喽,各位同学大家好,好久不见,甚是想念呢。今天小编想和大家分享的是一篇比较经典的文章(J Clin Lab Anal,2.3521),该工作主要基于构建坏死性凋亡相关的lncRNA特征预测头颈部鳞状细胞癌(HNSCC)的预后和免疫微环境,思路清晰,流程明确,方法简单,对于生物信息初学者而言非常友好。
Construction of a necroptosis-related lncRNA signature to predict the prognosis and immune microenvironment of head and neck squamous cell carcinoma
基于坏死性凋亡相关的lncRNA特征预测头颈部鳞状细胞癌(HNSCC)的预后和免疫微环境
已有研究表明坏死性凋亡相关基因是HNSCC的潜在生物标志物。因此,研究者意图通过建立一组基于坏死性凋亡相关lncRNAs (nrlncRNAs)的风险模型来预测HNSCC患者的预后。研究者首先基于相关性分析识别与坏死性凋亡基因表达相关的lncRNA,进一步通过单因素Cox分析筛选与预后相关的lncRNA,并基于最小绝对收缩和选择算子(LASSO)Cox回归建立由6个lncRNA构成的nrlncRNA特征,对患者进行高低风险组分型,二者预后存在显著差异。在nrlncRNA特征基础上,研究者建立nomogram生存预测模型,并进一步比较不同风险患者在基因表达、免疫药物响应、药物敏感性、m6A、肿瘤干性等方面的差异(图1)。
图1.流程图
1.数据
从TCGA获取HNSC中转录组数据和临床相关信息。将HNSC样本以1:1的比例随机分成训练数据和验证数据集合。
2.识别HNSCC的nrlncRNAs
研究者首先基于相关性分析识别出TCGA-HNSC数据集中与坏死性凋亡基因表达相关的694个lncRNA (相关系数>0.4,p<0.001)并构建互作网络(图2A),其中325个在肿瘤与正常样本间发生差异表达的nrlncrna,包括299个nrlncrna在HNSCC患者中发生上调, 26个在HNSCC患者中发生下调(图2B-2C)。
3. nrlncRNA风险模型的构建与验证
单因素Cox回归分析共发现29个nrlncRNAs与OS相关,其中10个nrlncRNAs与HNSCC预后不良有关,这29个nrlncRNAs均在HNSCC患者中发生上调(图2D-2F)。研究者对这29个nrlncRNAs进行LASSO Cox回归分析,最终建立由6个nlncRNA构成的nrlncRNAs特征打分(图2G-2H)。
图2. nrlncRNA风险模型的构建
根据nrlncRNA特征打分中位数,研究者分别对训练,验证以及所有患者进行高-低风险两组分型(图3A-C),并对患者的生存状态和特征nrlncRNA表达进行比较,结果表明高风险组患者预后较差,特征lncRNA在高低风险组中存在表达差异(图3D-L)。
图3. nrlncRNAs模型的预后价值
此外,在对不同年龄(图4A、B)、性别(图4C、D)、分级(图4E、F)、分期(图4G-N)等特定类型的样本中,基于nrlncRNAs特征的高低风险组样本间同样存在预后差异,表明nrlncRNAs特征独立于年龄,性别等临床特征。该风险模型的AUC值为0.699(图4O),显著优于年龄、性别、分级、分期等临床特征模型的分类效能(图4P)。
图4. nrlncRNAs模型与临床特征的关系
此外,评估风险模型的独立性以及包括年龄、性别、分级和分期在内的一些临床特征。单因素Cox回归分析(图5A)和多因素Cox回归分析(图5B)结果表明年龄和分期是两个独立的预后参数。研究者通过进一步整合风险评分和独立临床因素,构建预测HNSCC患者5年生存概率的nomogram图(图5C-D)。
图5.构建列线图预测模型
4.基因集合富集分析
研究者进一步基于GSEA富集分析高低风险组患者在通路活性层面的差异,结果表明两类患者在肿瘤侵袭和初次免疫应答等方面存在显著差异(图6A)。
5. 风险评分与免疫因子及肿瘤微环境的相关性
分别基于XCELL, TIMER, QUANTISEQ, MCP-counter, EPIC, CIBERSORT, and CIBERSORT-ABS等免疫浸润分析工具对HNSCC患者的免疫细胞浸润比例进行预测,并进一步比较不同风险患者在肿瘤微环境间的差异。结果表明,多种免疫细胞与风险评分呈负相关(如TIMER中的B细胞、CD4+ T细胞、CD8+ T细胞、巨噬细胞),提示低风险组具有较高的免疫浸润状态(图6B)。低风险组中CD8+ T细胞、dc细胞、Tfh细胞、Th2细胞、til细胞浸润较高,高危组巨噬细胞浸润较高。GSEA富集分析结果同样表明低风险组比高风险组具有更强的免疫相关功能,包括检查点、溶细胞活性、HLA、炎症促进、T细胞共抑制等(图6C)。低风险组免疫评分高于高风险组组,基质评分低于高风险组;然而,两组之间在ESTIMATE得分没有显著差异(图6D)。此外,大多数免疫检查点基因在低风险组中的激活程度更高(图6E)。
6. 风险模型与药物响应
基于pRRophetic包,研究者基于表达矩阵对患者的药物反应进行预测,比较高低风险组对不同药物的响应状态,结果表明高风险组患者对多西他赛、吉西他滨化疗的药物敏感性可能较高,顺铂或紫杉醇在两组样本间无响应差异(图6F)。
7. 风险模型与m6A相关基因和肿瘤干性的相关性分析
研究者进一步基于Wilcoxon检验探究风险评分与m6A基因的相关性,大多数m6A相关基因在低风险组中表达较高(图6G)。此外,构建的风险特征与肿瘤干性打分显著负相关(图6H)。
图6.风险评分与免疫浸润、药物响应、m6A表达和肿瘤干性的相关性
8. 基于特征nrlncRNAs的聚类分析
基于6个特征nrlncRNAs表达,研究者通过ConsensusClusterPlus包对患者进行聚类(图7A)。大部分高危组患者被重新分组到聚类1;聚类2主要由低风险患者构成(图7B),且聚类2的预后更好(图7C)。主成分分析结果显示,不同风险组和聚类形成不同的成分(图7D),tSNE降维结果中高低风险组和不同类别同样可以很好区分(图7E)。聚类1的免疫、基质和ESTIMATE得分低于聚类2((图7F))。不同类别患者中,肿瘤免疫微环境存在显著差异(图7G)。此外,TNFRSF18、LAG3、CD244和TNFRSF14等免疫检查点基因在聚类2中表达较高(图7H)。聚类1对吉西他滨治疗更敏感;聚类2对紫杉醇和多西他赛治疗更敏感。顺铂响应在两组间无显著差异(图7I)。
图7. 基于特征nrlncRNAs的聚类分析
本篇文章的主要内容就是这些,思路清晰,方法简单,是一篇比较基础的生物信息学分析工作。当然,文章中还存在一些小问题,比如流程图中的lasso错写成lasoo;没有独立的外部数据集合验证;部分结果的描述过于简单,没有深层次描述结果的潜在生物意义等。同学们在进行自己的工作时要对这些问题多加注意,莫不要因为一些小的瑕疵就掩盖掉美玉的本质哦。
今天的内容就是这些,我们下次再见啦~
参考文献:
1. Construction of a necroptosis-related lncRNA signature to predict the prognosis and immune microenvironment of head and neck squamous cell carcinoma