阿尔茨海默症 (AD) 目前被认为是全世界最著名的痴呆症形式,由于缺乏早期诊断以及有效的治疗手段,患者预后较差。关于阿尔茨海默症,研究人员从未停止过探索,今天小编就带大家阅读一篇2023年2月21日发表在Frontiers in Immunology(IF:8.786)的文献吧!
Integration of bulk RNA sequencing and single-cell analysis reveals a global landscape of DNA damage response in the immune environment of Alzheimer’s disease
整合Bulk RNA测序和单细胞分析揭示了阿尔茨海默症免疫环境中DNA损伤反应的全局图景
全文概述
本研究使用179个 DNA 损伤反应 (DDR)调节因子评估了AD患者的DDR模式。进行单细胞技术以验证认知障碍患者的DDR水平和细胞间通讯。在采用WGCNA方法发现DDR相关lncRNA 后,共识聚类算法用于将167名AD患者分组为不同的亚组。评估了不同亚型之间在临床特征、DDR水平、生物学行为和免疫学特征方面的差异。为了选择与DDR相关的lncRNA,使用了四种机器学习算法( LASSO、SVM-RFE、RF和XGBoost)建立风险模型。AD的进展与DDR水平高度相关。单细胞分析证实,认知障碍患者的DDR活性较低,主要富含T细胞和B细胞。基于基因表达发现了DDR相关的lncRNA,并鉴定了两种不同的异质亚型(C1和C2)。 DDR C1属于非免疫表型,而DDR C2被认为是免疫表型。基于各种机器学习算法,发现了四个与DDR相关的lncRNA,包括 FBXO30-DT、TBX2-AS1、ADAMTS9-AS2和MEG3。基于4-lncRNA的 riskScore在诊断AD方面表现出较好的效能,并为AD患者提供了显着的临床优势。与低风险组相比,高风险患者表现出较低的DDR活性,并有着较高水平的免疫浸润和免疫学评分。用于治疗低危和高危AD患者的前瞻性药物还分别包括花生四烯基三氟甲烷和TTNPB(图1)。
DDR相关基因在AD患者中的作用
在排除异常脑组织样本后,共有150 个正常脑组织样本和161个AD脑组织样本。在已发表的研究中获得的200个DDR相关调控基因,其中179个基因包含在合并数据集中。与正常组相比,在AD脑组织中观察到51 个DDR调节因子的异常表达,表明AD患者与健康受试者之间的生物学行为存在显着差异(图2A)。富集分析表明,这些差异表达的DDR调节因子主要富集在DNA损伤修复相关过程中。
为了系统地阐明51个差异表达的 DDR调控因子之间的关系,作者将这些基因分为三种类型,并生成了一个调控网络,显示了这些DDR相关基因之间的相互作用,其中大部分显示出实质性关联(图2B)。随后,为了进一步说明DDR和AD之间的关系,基于差异表达的DDR 调节因子,使用 ssGSEA 算法计算每个样本的DDR分数。发现AD患者在组合数据集中表现出显着低于非AD个体的DDR评分(图2C),这与其他三个外部验证数据集的结果一致(图2D–F)。这些结果表明,这些DDR调节基因之间的相互作用可能在保持基因组完整性方面发挥重要作用,而DDR 的失调可能是导致AD进展的重要因素。
此外,作者进一步分析了DDR与28个浸润免疫细胞亚群之间的相关模式(图2G)。较低的DDR 评分代表较高水平的免疫细胞浸润,表明低DDR评分和高度浸润的免疫细胞的协同作用可能促进AD的进展。
在单细胞水平上对DDR进行分析
为了研究AD中各种浸润免疫细胞的DDR活性差异,将来自15个MCI/AD样本和44个正常CSF样本的70391个分选细胞划分为12个簇,最终注释了7种细胞类型(图3A–C)。每组的细胞类型分数显示认知障碍 (CI) 组中所有细胞类型的百分比下降(图3D)。图3E展示了每种细胞亚型的前15个标记基因的表达模式。然后使用“UCell”算法计算了每个细胞的DDR分数,结果表明具有较高DDR分数的细胞主要富集在正常样本中,特别是在T和B细胞区域(图3F-H),这与批量转录组学分析的结果一致。由于T细胞占最大比例,接下来进一步探讨了DDR在不同T细胞亚群中的表达。提取并重新分析T细胞,共鉴定出12个簇(图3I、J)。所有六种主要细胞类型在对照组和CI组之间均存在显着差异。 UCell算法结果显示,除Tcm/Naive辅助T细胞外,所有T亚型的 DDR 分数均不同程度上调(图3K,L)。
认知障碍进展中的细胞间相互作用
随后,作者进行了CellChat分析,以探索认知障碍进展过程中的细胞间相互作用。交互次数和强度从正常到认知障碍增强。与正常组相比,CI组中的巨噬细胞、ILC 和pDC细胞与其他细胞类型表现出更强的相互作用数量和相互作用强度。而DC 细胞和B细胞与正常组中的单核细胞和pDC细胞频繁通讯(图4A、B)。然后通过比较每个通路的相互作用强度,在对照组和CI组之间确定特定通路(图4C)。此外,在认知受损的CSF样本中观察到T细胞与其他细胞类型之间的强通信概率。然而,CD40LG与ITGAM+ITGB2和ITGA5+IRGB1之间的通信是CI组所独有的(图4D)。
DDR相关长链非编码RNA的探索
为了进一步阐明DDR的调控模式,进行了WGCNA分析,并根据组合数据集中 lncRNA的表达谱筛选了DDR相关的lncRNA。根据最优软阈值β,对聚类树状图的样本进行层次聚类,得到10个不同颜色的lncRNA共表达模块(图5A)。在交集之后,最终筛选出33种常见的DDR相关lncRNA(图5B),构建DDR-lncRNA 共表达网络(图5C)。33个DDR 相关lncRNA在对照组和AD患者之间的不同表达模式,其中31个在AD患者中显着上调,2个DDR相关lncRNA在健康个体中上调(图5D)。
识别AD患者的DDR亚型
基于33个DDR相关lncRNA的表达图谱,使用共识聚类算法将AD样本分为不同的亚型,每个亚型具有不同的DDR调控状态(图6A)。将167名AD患者被分为两个亚型,包括74例C1和93例 C2。 tSNE分析揭示了C1和C2集群之间AD患者分布的显着差异(图6B)。DDR C2显示出相对于DDR C1较低的DDR评分(图6C),表明DDR C2患者缺乏DDR调节。然而,年龄和性别分布在DDR C1 和 DDR C2 亚型之间没有统计学差异(图6D、E)。热图表明,这些与DDR相关的lncRNA在不同的DDR簇之间明显不同,并且大多数lncRNA在DDR C2中上调(图6F)。
DDR亚型之间分子功能和通路的特征
DDR亚型之间进行DEG分析,探究转录组学差异。共获得2472个DEG(2859 个上调和1856个下调)。基于GSVA算法的功能注释显示DDR C2主要参与肌管分化、血管内皮生长因子受体激活、细胞间连接、神经元突起再生、细胞周期停滞和免疫反应。相反,DDR C1与线粒体和氨基酸代谢、tRNA 和溶酶体转运以及蛋白质定位相关的生物学功能密切相关(图7A)。通路富集分析表明,DDR C2 主要由免疫调节、细胞因子-细胞因子相互作用和几种经典信号通路驱动(图7B)。一致地,GSEA结果表明DDR C2中B细胞受体信号通路、细胞因子-细胞因子受体相互作用、JAK-STAT信号通路、自然杀伤细胞介导的细胞毒性和Notch信号通路上调(图7C)。DDR C1的特征在于DNA复制、糖异生、溶酶体、氧化磷酸化和 RNA 降解(图7D)。这些结果突出了亚型1和亚型2之间不同的分子功能和通路。
识别DDR亚型之间的免疫特征
为了更好地阐明DDR亚型之间免疫微环境的差异,首先全面研究了免疫浸润水平之间的相关性。基于ssGSEA、MCPcounter、xCell、ABIS和ESTIMATE方法的免疫细胞亚群热图如图8A所示,这表明大多数类型免疫细胞的浸润水平主要分布在 DDR C2。接下来,进一步研究了DDR表型与各种免疫调节剂和免疫检查点之间的相关性。 DDR对AD免疫微环境影响的结果显示,CD28和CD80等共刺激因子在DDR C2亚型中的表达水平显着升高。此外,在DDR C2亚型中也可见抗原呈递、细胞粘附、共抑制物、配体、受体等功能的表达增加。与DDR C2相比,DDR C1表现出更高的CD274和CX3CL1表达(图8B)。此外,DDR C2还表现出更强的免疫得分,这表明对免疫疗法的反应更强(图8C)。基于以上结果,作者认为DDR C2是免疫相关亚型,DDR C1是一种代谢表型。
基于机器学习选择特征的DDR相关lncRNAs
为了进一步确定能够准确诊断AD的DDR相关lncRNA,使用四个机器学习模型(LASSO、RF、SVM-RFE和XGBoost),在33个DDR相关lncRNA的表达图谱基础上进行特征选择。使用LASSO分类器最终筛选了15个具有非零系数的DDR相关lncRNAs(图9A)。ROC曲线分析显示,基于15个lncRNA的LASSO模型的AUC在训练集为0.745,在测试集为0.743(图9B)。随后,确定了9个lncRNA的组合在基于SVM-RFE模型预测AD发生方面表现出最高的准确性(图9C)。接下来采用Boruta特征选择算法,共确定了14个重要的lncRNAs。这14个由Boruta算法筛选出来的特征被纳入到RF模型中,在训练集中的AUC值为1,在测试集中为0.731(图9D)。此外,对于AD的识别,XGBoost分类器在训练集和测试集的AUC分别达到1和0.778(图9E)。FBXO30-DT、ADAMTS9-AS2、TBX2-AS1和MEG3在LASSO、SVM-RFE、RF和XGBoost算法均有重要的作用,被确定为DDR相关lncRNAs(图9F)。
风险模型和列线图的建立
这四个不同的与DDR相关的lncRNAs被用来计算DDR相关的风险分数,使用它们相应的LASSO模型系数:风险分数=(-0.188478×FBXO30-DT)+(0.117249× ADAMTS9-AS2)+(0.129318×TBX2-AS1)+(0.320641×MEG3)。随后,使用ROC曲线分析评估了风险分数和临床特征(年龄和性别)在预测合并数据集中的AD进展方面的诊断功效。基于ROC曲线,预测模型的AUC值为0.712,年龄为0.558,性别为0.455,AD患者表现出明显较高的riskScore(图10A,B)。这些结果表明,风险分数可以比经典临床指标更准确地预测AD的进展。由性别、riskScore和年龄构成的提名图显示了这些特征在诊断AD方面令人满意的预测结果(图10C),计算的校准曲线证明了列线图的稳健性(图10D)。此外,DCA表明基于风险分数的列线图在临床上是有益的(图10E)。
低危和高危人群的临床价值和分子通路
为了全面说明AD的DDR 风险得分相关机制,作者建立了一个风险模型,并根据中位风险分数将总共167个AD样本分为低风险和高风险组。这四个与DDR相关的lncRNAs在低风险组和高风险组之间有着不同的表达模式,其中MEG3、TBX2-AS1和ADAMTS9-AS2在高风险组的表达水平更高。而在低风险组中,FBXO30-DT的表达明显较高(图11A)。Sankey图全面描述了低风险组和高风险组中不同亚型和临床指标比例的细节。高危组的DDR C2亚型样本更多,而性别和年龄分布在低、高危组之间没有明显差异(图11B-D)。此外,通过比较这两个风险分数组之间的DDR分数水平,低风险组的DDR分数相对于高风险组要高(图11E)。
GSEA显示,高危组在自身免疫性疾病、细胞因子-细胞因子受体相互作用、ECM受体相互作用、JAK-STAT信号通路、自然杀伤细胞介导的细胞毒性。和神经活性配体受体相互作用中富集(图11F),而低风险组在TCA循环、DNA复制、氧化磷酸化、戊糖磷酸盐途径、嘧啶和丙酮酸代谢以及RNA降解相关的通路调节中富集(图11G)。
为了评估AD患者的个体化临床治疗,作者使用CMap数据库分别探索了低风险和高风险人群的潜在治疗药物。对低风险组来说,前5个蕴含个体化治疗潜力的药物如下。W-13, XAH-6809, TTNPB, butein, 和花生三氟甲烷(图11H)。而vorinostat、alsterpaullone、STOCKIN-35874、花生醇三氟甲烷和TTNPB是对高风险AD患者最有效的五种治疗药物(图11I)。特别是花生醇三氟甲烷和TTNPB在低风险组和高风险组的CMap得分分别最低,揭示了不同风险的AD患者的最佳治疗效果。
不同AD风险患者之间免疫微环境和治疗药物的差异
根据ssGSEA、MCPcounter、xCell、ABIS和ESTIMATE算法,作者还探讨了低风险组和高风险组的浸润细胞情况。在高危组中观察到多种免疫细胞亚型(图12A)。此外,免疫调节剂和免疫检查点在不同风险的AD患者之间存在明显的差异。相对于高风险的AD患者,低风险患者只显示出HMGB1的高表达(图12B)。此外,在低风险组可以观察到免疫得分的明显降低,表明对免疫治疗的反应性差(图12C)。相关分析也表明,较高的风险分数与大多数类型的免疫细胞呈正相关,并显示出免疫的卓越浸润水平(图12D)。
总结
文章到这里就要结束,作者整合bulk和单细胞数据探究DDR调节因子在AD患者中的影响,并构建了诊断模型。文章思路清晰明了,也非常适合生信小白学习。现在生信分析已经成为研究过程中不可缺少的环节,想要更进一步的小伙伴千万不要落下了,赶紧学习起来吧!