导读
单细胞RNA测序(scRNA-seq)在单细胞水平上促进对复杂细胞混合的肿瘤的研究。然而,用scRNA-seq技术分析人类组织也是具有挑战性的,因为不可能将完整的细胞从这些现有的固体组织活检中分离出来。单细胞核RNA(snRNA-seq)测序技术克服了这些技术挑战,随着scRNA-seq和snRNA-seq技术的改进,它们在组织中的用途已越来越大。
背景知识
目前已经在肝癌中发现了多种癌症基因,包括肿瘤抑制基因的突变,如肿瘤蛋白P53(TP53)。然而,我们尚不清楚这些体细胞突变是否与肝细胞癌的细胞类型变化有关。为了解决这一问题并阐明相关细胞类型的分子机制,下文作者利用scRNA-seq/snRNA-seq联合bulk-seq发现并分析了一种与肝癌风险相关的细胞类型,Prol,以补充已知的体细胞癌突变。利用体细胞突变分析,作者还发现体细胞的TP53和RB1突变与肝细胞癌中Prol的增殖有关。下面我们来具体看一下这篇文章吧!
结果解读:
作者利用相关的RNA-seq数据集:从非酒精性脂肪肝相关肝细胞癌患者的肝癌组织和邻近非肿瘤肝活检组织的肝脏snRNA-seq数据集;肝细胞癌、邻近的非肿瘤组织和正常肝脏样本的肝脏scRNA-seq数据集;利用TCGA数据库和肝癌研究所(LCI)的肝细胞癌和癌旁组织的bulk RNA-seq数据集。另外,作者还在TCGA和LCI队列中描述了细胞类型(与肝细胞癌增加相关)对生存结果的影响。最后,作者寻找体细胞突变与肝细胞癌中增加的细胞类型比例估计之间的联系。
为了分解TCGA和LCI队列中的肝脏bulk RNA-seq细胞类型,作者首先建立了一个单细胞水平的参考数据集。作者利用snRNA-seq或scRNAseq生成的三个单细胞水平的队列来构建参考数据集。为了识别相同的细胞类型并纠正这些批次效应,作者使用CCA方法(canonical correlation analysis,典型相关分析)整合了这些单细胞水平的表达数据,该方法可以在减少技术差异的同时保留生物意义的信号,综合数据使用Seurat进行分类,结果识别出25种细胞类型(图2a、b)。
根据它们的谱系,将识别的25种亚细胞类型合并为8个主要细胞类型(图2a)。根据已知标记基因的表达和富集的通路对亚细胞类型和主细胞类型进行分类(图2c)。然后作者在HCC中检测富集或耗竭的亚细胞类型/细胞类型(图2d)。作者观察到一种新的细胞类型群中肿瘤细胞显著富集(80.4%),作者将其命名为增殖性(Prol)细胞型(图2d,e)。接下来,作者探索了Prol细胞类型中的标记基因,以进一步了解其生物学特性。作者发现了三个基因,HMGN2,RARRES2和HIST1H4C,这些基因以前在其他恶性肿瘤中被描述过,但在肝细胞癌中没有。其中两个,HIST1H4C和HMGN2,是与核小体DNA结合的核蛋白,与Prol具有更高的S和G2M得分一致(图2 f,g)。总体而言,单细胞水平的参考数据表明Prol细胞类型与肝细胞癌相关。
接下来,作者在单细胞水平上验证细胞类型组成变化是否在肝癌中普遍存在。因此,作者计算了TCGA肝细胞癌(TCGA-LIHC)队列中8种主要细胞类型和25种亚细胞类型的细胞类型比例。在8种细胞类型中,作者发现在49例肝癌中,只有Prol显著增加,而在肿瘤中有5种细胞类型显著减少(图3a。T、Myel、Chol、B、Hep簇)。Prol丰度的增加与单细胞水平上观察到的数据结果一致(图3a和图2d)。为了复现作者在TCGA队列中发现的细胞类型差异,作者研究了LCI队列,该队列主要由亚洲肝细胞癌患者组成(HBV-HCC)。在LCI和TCGA队列中,作者发现肿瘤和非肿瘤组织之间的细胞类型变化相似(图3b)。 在LCI队列中,只有Prol细胞类型在肝癌中显著增加(图3b),而髓系、T和Hep簇在TCGA和LCI中都显著减少,其中Hep下降最大。然后,作者通过分析bulk肝脏数据中肿瘤和邻近非肿瘤之间的基因表达,来验证观察到的HCC中ProL比例估计的增加。与其他细胞类型相比,Prol簇的标记基因在TCGA和LCI队列中表达最高(图3c、d)。另外,作者发现,当使用TCGA中肿瘤上调基因时,来自Prol的细胞/核具有最高的bulk tumor scores (图3e-h)。综上所述,Prol标记基因在实体HCC组织水平的显著增加,并且,实体肿瘤中的上调基因在Prol细胞类型中的表达最高,。
为了确定Prol细胞类型对TCGA患者生存结果的临床意义,作者评估了它对361名HCC患者的总生存期(OS)和无进展间期(PFI)的影响。作者使用中位数将HCC患者分成低和高细胞比例两组,在TCGA中,两组OS和PFI的风险比都在1以上(图 4a、b)。作者分析了标记的基因表达与生存结果之间的关系。作者观察到,与其他细胞类型相比,高比例的Prol特异性标记基因对OS和PFI的风险比大于1(图4 d,e)。另外,作者发现Prol核/细胞的OS平均下降率最高(图4g、h和图4j,k))。同样作者在LCI队列中也得出相同的结果(图4i)。作者强调了Prol细胞类型与不良生存预后相关。总体而言,基于bulk的单细胞水平的研究结果表明,Prol核/细胞显著过度表达tumor-elevated bulk DE基因(图4e-h)和survival-decreasing bulk的DE基因(图4 g-l),该结果进一步证实了Prol细胞类型与肝细胞癌和较差生存率的关联。
作者仍然不清楚体细胞突变是否会导致特定的肿瘤细胞类型的扩张或耗竭。因此,作者分析了细胞类型特征与69个显著突变基因突变之间的关系。作者确定了3个与较高的细胞类型丰度相关的基因。其中,TP53和RB1突变导致Prol肿瘤细胞类型的预测比例显著增加(图5a)。此外,在携带TP53突变或RB1突变的个体中,Prol是唯一显著增加的细胞类型(图5b)。已知TP53中的许多突变会导致P53的肿瘤抑制功能丧失,从而导致细胞生长失控。作者观察到,TP53错义、移码和无义突变导致Prol的比例显著增加(图5c)。虽然移码和无义突变可能导致功能的完全丧失,但已经发现TP53的错义突变主要发生在蛋白质的DNA结合区域,也导致其肿瘤抑制功能的丧失。为了进一步研究Prol细胞类型是否是TP53突变的主要结果,作者鉴定了TCGA数据中TP53突变患者和TP53野生型患者间的差异表达基因,然后根据在TP53突变组中差异上调基因计算单细胞水平数据中各种细胞类型的TP53突变得分。发现Prol细胞/核的TP53突变分数显著高于其他所有细胞/核(图5d,f)。对于RB1突变作者用了同样方法进行分析,发现了类似的结果。总之,这些结果表明,不同的体细胞突变可以导致肿瘤细胞的扩张,并突出了TP53突变在增殖和失控的细胞生长中的作用。
全文总结:
snRNA-seq相比scRNA-seq在样本丰富度上更有优势,不再仅局限于新鲜样本,也适合与一些难解离样本。虽然snRNA-seq有这样优势,但并不意味着snRNA-seq就可以完全替代scRNA-seq,首先snRNA-seq检测的是细胞核中的RNA,检测到的RNA数量还是少于整个细胞可以检测到的数量;其次对于某些细胞类型,scRNA-seq可以获得更多的免疫细胞,而snRNA-Seq得到更多的恶性肿瘤细胞分型。总而言之,snRNA-seq与scRNA-seq两种方法各有优劣,整合snRNA-seq、scRNA-seq和bulk RNA-seq数据可以很全面的探究疾病的细胞类型差异。
参考文献
1 Alvarez, M. et al. Human liver single nucleus and single cell RNA sequencing identify a hepatocellular carcinoma-associated cell-type affecting survival. Genome Med 14, 50, doi:10.1186/s13073-022-01055-5 (2022).