利用血源性外泌体中的转录组学信息和肿瘤微环境中的单细胞多组学数据构建 KIRC 诊断模型
今天分享的文章, 于2023年4月19日发表在Frontiers in Immunology (IF: 8.786), 题为“Dissecting order amidst chaos of programmed cell deaths: construction of a diagnostic model for KIRC using transcriptomic information in blood-derived exosomes and single-cell multi-omics data in tumor microenvironment” 。
肾透明细胞癌 (KIRC) 是最常诊断的肾细胞癌 (RCC) 亚型; 然而,KIRC 的发病机制和诊断方法仍然不清楚。作者收集了 6 个 细胞死亡相关基因(CDRG) 类别,包括细胞凋亡、坏死性凋亡、自噬、细胞焦亡、铁死亡和铜细胞凋亡。 利用 exoRBase 数据库的血液外泌体的 RNA 测序 (RNA-seq) 数据、癌症基因组图谱 (TCGA)数据库组织的 RNA-seq 数据联合GTEx 数据库的对照样本,以及GEO数据库中单细胞 RNA 测序 (scRNA- seq)的数据。 作者首先将来自 exoRBase 和 TCGA 数据库的 KIRC 队列的差异表达基因(DEGs)与从单细胞数据集中获得的 CDRGs 和 DEGs 进行交叉,然后, 进一步使用临床指标和机器学习方法筛选出候选生物标志物基因,从而构建一个 KIRC 的诊断模型。 最后,使用 scRNA-seq、用于转座酶可及染色质测序的单细胞分析 (scATAC-seq) 和空间转录组学测序 (stRNA-seq) 数据研究了关键基因的潜在机制及其在肿瘤微环境中的作用。本文证明13-基因诊断模型在KIRC筛查中具有较高的准确性,而TRIB3high肿瘤上皮细胞可能是KIRC有前景的治疗靶点。
一 背景
肾细胞癌 (RCC) 是最常见的肾脏肿瘤,占肾脏恶性肿瘤的 90% 和所有癌症的 3% 。 肾透明细胞癌 (KIRC) 是最常诊断的病理分类,约占 RCC 的 80% 。 尽管 KIRC 预后相对良好,但近 30% 的局部晚期病例会因局部复发或远处转移而复发 。关于该疾病的发病机制和潜在机制仍有许多问题有待阐明,而且对 KIRC 诊断方法的鉴定研究还处于起步阶段。 构建一个涵盖筛查、诊断和预后预测的新型临床模型对临床环境具有巨大意义,并为精准医学治疗决策提供新见解。本研究的数据集信息和工作流程如图 1 所示。
二 结果
多个组织来源中KIRC的转录组信息
首先从GEO数据库提供的五个独立数据集中收集了48个KIRC样本。样本包含癌症、癌旁组织和来自肾切除术或活检检查的健康组织。保留了来自五个独立数据集的216,155个单细胞并用于以下分析。用Seurat包处理并去除批次效应后,确定了54个细胞簇和10种主要细胞类型以及细胞类型的特定标记和相对丰度(图2A, 图2B)。上皮细胞在所有细胞区中占主导地位,表达CA9的典型标志物的肿瘤上皮细胞完全来自肿瘤组织和具有多种起源的正常上皮细胞。使用UMAP可视化了每种主要细胞的类型及其起源的分布(图2C)。随后,根据他们的表达谱探索了各种只要细胞类型的癌症和对照样本之间的DEG,条形图显示了上调和下调DEG的确切计数,饼图显示它们在KEGG路径中显示其相应类别(图2D),其中大部分属于“人类疾病”。有趣的是,肿瘤和正常上皮细胞之间的DEG数最高,其次是癌症和对照样本之间的Endo和Fib之间的DEG(图2D),证明了转录组结构细胞的显著改变及其在肿瘤发生中的基本阶段。接下来,根据TCGA队列与GTEx中的健康样本合并,进一步解剖了KIRC的转录组景观(图2E),揭示了癌症组织中4604,604个上调和2,073个下调DEG(图2F)。
KIRC中CDRGs的表达模式
作者分析了细胞凋亡、坏死性凋亡、自噬、细胞焦亡、铁死亡和铜死亡等六种 PCD 及其相关基因 CDRG,显示出共性和特异性(图 3A)。 可以看出铁死亡和自噬共享的基因数量非常多。 图 3B 所示,大多数 CDRG 在单细胞和 RNA-seq 数据集中都是上调的 DEG,下调的 DEG 比例非常低,其中大部分属于自噬、细胞凋亡和铁死亡途径。 这种现象提出了一个说明性的断言:CDRGs 的表达水平有不同程度的增强。接下来,作者将 exoRBase KIRC 中上调(图 4A)和下调(图 4B)的 DEG 与从单细胞和 TCGA 数据集中获得的 CDRG 和 DEG 相交,以筛选53个候选生物标志物基因。其中, 20 个基因被上调(图 4C),33 个基因在 KIRC 患者的血液来源外泌体中被下调。 同时,候选生物标志物基因的这种差异表达趋势在 TCGA 数据集和上皮细胞、Endo 和 Fib(即结构细胞)的单细胞数据集中基本一致。 这些发现表明外泌体在协调与肿瘤细胞的对话和深刻影响 TME 改变方面的关键作用。这 53 个候选生物标志物基因与临床标志物之间的相关性表明,53 个基因中的 32 个与患者的临床分期或生存结果密切相关,在 KIRC 中作为风险或保护因素发挥双重作用(图 4D)。 此外,与铁死亡和自噬相关的基因占32个,其中一小部分基因属于细胞凋亡和坏死性凋亡。 其中,32 个基因中有 13 个同时与 KIRC 的临床分期和生存结果相关包括 PIP4K2C、FIS1、PSAT1、ERBB2、TRIB3、CLU、GABARAPL2、LRBA、PCK2、CDKN1A、 FKBP1A、MAP1LC3B 和 ITGA6基因。
13-基因诊断模型验证及机制探索
作者使用 13 个关键基因构建了 KIRC 的诊断模型,首先, 将 exoRbase 数据库中的所有样本随机分为两组(训练集和测试集),比例为 3:2 以进行交叉验证。 可以看出13- 基因诊断模型在 exoRbase 数据库的 KIRC 数据集中表现出出色的鉴别能力(图 5A),训练集和测试集的 AUC 值分别为 1 和 0.965。同样,用 TCGA KIRC 队列中的 13 个基因构建的模型显示出有希望的诊断结果,训练和测试集中的 AUC 值分别为 1 和 0.982(图 5B)。 此外,由包含 656 个 KIRC 病例的 GEO 数据库提供的 GSE167093 被用作额外的验证队列,表现出极高的诊断准确性,AUC 值为 0.914。 研究结果明确表明,13- 基因诊断模型在检测 KIRC 时非常稳定和值得信赖,无论样本是取自血液来源的外泌体还是实体组织,都确保了高灵敏度和特异性。作者根据 scRNA 数据发现这些基因在不同细胞类型中的异常表达模式,尤其是 CLU、CDKN1A、PSAT1 和 MAP1LC3B,它们在几乎所有细胞类型中都有差异表达。 随后,作者分析了 KIRC 病例的 scATAC 数据集中的 63,489 个细胞,根据标记基因识别了 15 种主要细胞类型(图 5C、D)。 有趣的是,作者发现 TRIB3 表达在肿瘤上皮细胞中高于正常上皮细胞。 同时,与正常 PT 细胞簇(图 5E)(肾脏中常见的上皮细胞类型)相比,其染色质可及性显着增加。
TRIB3high 肿瘤上皮细胞综合描述
接下来,作者研究了 TRIB3 在 TME 及其相应细胞亚群中的影响。 对 TRIB3 的分析表明,该基因与 KIRC 的 TNM 分期呈正相关(图 6A-C),暗示其在 KIRC 的生存结果中起不利作用,这可能是癌细胞转移的主要原因。 因此,作者侧重于了解 TRIB3 在肿瘤上皮细胞特定表型中的作用,后者是从 scRNA 数据集中提取的,并在降维后进一步可视化。 值得注意的是,TRIB3high 子集出现在分散的肿瘤上皮细胞中(图 6D),并且与 PT 具有更高的相似性(R = 0.864)(图 6E)。 此外,伪时序分析表明,这种细胞亚群可能是原始癌症干细胞(图 6F)。 细胞间通讯分析表明,TRIB3high 肿瘤细胞的相互作用比其他细胞类型更广泛、更强烈,尤其是与 Mac 和 T 细胞的相互作用(图 6G)。 同时,甘油醛-3-磷酸脱氢酶 (GAPDH) 的高表达可能预示着这种细胞类型具有很强的外泌体组装和聚集能力。 细胞-细胞相互作用网络分析的结果揭示了 TRIB3high 肿瘤上皮细胞与其他细胞类型在某些特定区域具有更高的相互作用。与其他细胞簇相比,TRIB3high 肿瘤上皮细胞主要富集细胞凋亡、铁死亡、核糖体和溶酶体信号通路(图 7A、B)。 最后,空间转录组学分析证实 TRIB3high 子集在肿瘤组织中高度富集(图 7C)。
讨论和结论
作者成功构建具有 13 个基因的诊断模型, 并在血源性外泌体样本和组织样本中均显示出高诊断效能。 基于单细胞组学的溯源分析表明,基因的表达和改变在TME中以多种细胞身份呈现,尤其是在结构细胞和巨噬细胞中。值得注意的是,癌细胞可以分泌外泌体诱导癌症相关成纤维细胞和癌症相关内皮细胞的产生,从而促进 TME 的重塑。并且作者发现其中一个基因,TRIB3 的高表达与 KIRC 患者的晚期临床分期和较差的预后密切相关。