小编今天给大家带来的是今年一月发表在CANCER RESEARCH(IF:13.312)上的一篇文章。肾透明细胞癌(ccRCC)具有高度的肿瘤异质性。本文中作者对19个ccRCC样本进行了scRNA-seq和scATAC-seq以及全外显子组测序来了解个体之间的异质性。构建ccRCC的单细胞转录组和染色质可及性图谱,揭示ccRCC中不同肿瘤细胞亚型的调控特征。
肾癌是泌尿系统最常见的癌症之一,其发病率每年都在增加。肾透明细胞癌(ccRCC)是最常见的肾癌类型。近年来,ccRCC靶向治疗和免疫检查点抑制剂治疗取得了多项突破和巨大进展。然而,无病生存率的整体改善仍十分有限。晚期肾细胞癌(RCC)死亡率仍然很高。ccRCC是一种具有潜在高水平肿瘤异质性和遗传易感性的疾病。TCGA关于ccRCC的项目在DNA、RNA和蛋白质水平以及重要分子途径上对ccRCC患者进行了研究,很好地说明了ccRCC的遗传特征。但由于无法分析到单个肿瘤细胞,因此仍存在一定的局限性。近年来,许多针对ccRCC的scRNA-seq研究在单细胞水平上揭示了肿瘤细胞、肿瘤特异性标志物和肿瘤免疫微环境的特征。然而这些研究忽视了ccRCC的表观遗传调控。
文章对19个ccRCC样本进行了单细胞多组学研究。在研究中,作者通过整合19个ccRCC样本(共约16.4万个细胞)的scATAC-seq和scRNA-seq,结合全外显子组测序,揭示了ccRCC的表观遗传调控特征。
通过质量控制,一共获得了102,723个高质量的细胞。根据以往研究中标记基因的表达对细胞注释,将ccRCC分为22种独立的细胞类型,包括4种肿瘤细胞亚型,4种内皮细胞亚型等(图2B,C)。在ccRCC中,T细胞数量最多,其次是肿瘤细胞(图2D)。由于ccRCC的肿瘤异质性,对来自19个不同个体的肿瘤样本进行了scRNA-seq。大多数细胞类型没有样本差异,而肿瘤细胞和内皮细胞之间的个体差异比较明显(图2E)。广泛的免疫细胞浸润,特别是T细胞和TAMs,是ccRCC免疫微环境的特征。
考虑到ccRCC的遗传易感性,作者对所有ccRCC样本进行了全外显子组测序,以了解个体之间的DNA变异。常见突变基因的变异与以往研究中发现的相似。VHL是最常见的突变基因,突变率为84.2%(图3A)。CA9、KRT14、CD24也表现出较高的突变率 (图2A),将肿瘤细胞分为VHL、CA9、KRT14和CD24突变组和非突变组,并比较它们的基因表达差异。发现突变和非突变肿瘤细胞的基因表达非常相似,Pearson相关系数大于0.98(图2B-E)。这也说明ccRCC中单个突变基因并没有引起肿瘤细胞所有基因表达的巨大变化。
根据基因表达特征,肿瘤细胞被聚类为4个细胞亚型。除ccRCC 4外,其余三种肿瘤细胞亚型无患者间异质性(图4A,B)。虽然个体差异仍然存在,但在肿瘤细胞中,细胞亚群分类有很好的代表性。ccRCC 1高表达CA9和NDUF4AL2;ccRCC 2高表达KCNQ1OT1和CP;ccRCC 3高表达NDUF4AL2和CYB5A,而ccRCC 4在肿瘤细胞中表达大部分高表达基因(图4C)。CA9、NDUF4AL2和CP在之前的研究中被确定为ccRCC的标记基因。KCNQ1OT1是一种致癌的lncRNA,但这是第一次通过scRNA-seq发现KCNQ1OT1在特定的ccRCC细胞亚型中高表达。
之后进行了CNV分析,发现这些肿瘤细胞亚型存在不同的CNV特征(图4D)。大多数肿瘤细胞特征是3号染色体的丢失和5号染色体的增加。这一结果集中在ccRCC 1中(图4D)。这可能是由克隆或亚克隆肿瘤细胞引起的。因此,可以利用scRNA-seq的结果来预测处于根状态的肿瘤细胞以及肿瘤细胞的进化方向。结合RNA速度和Monocle3来重建肿瘤细胞的进化轨迹。结果发现ccRCC 4位于根,提示其可能是干细胞样细胞,可分化为ccRCC 1、ccRCC 2和ccRCC 3(图5)。
接着作者希望预测这四种肿瘤细胞类型的预后。基于scRNA-seq的结果,计算每种肿瘤细胞类型的DEGs。选择每个细胞亚型的前100位的DEGs,并根据TCGA数据确定预后结果。ccRCC 1、ccRCC 2和ccRCC 3中大部分的DEGs提示阳性生存,而ccRCC 4中更多的DEGs提示预后不良(图4E)。
与肿瘤细胞类似,内皮细胞在ccRCC中也有4种细胞亚型(图6A-B)。存在一种具有癌症相关成纤维细胞(CAF)标记(TAGLN, PDGFRB, COL1A2和ACTA2)的内皮细胞亚型(Endo cells 3)。内皮细胞和成纤维细胞在肿瘤微环境中可以相互转化,该结果支持了ccRCC中存在这种转化的可能性。另一方面,随着ccRCC样本数量的增加,内皮细胞的亚型比之前的研究更多,说明内皮细胞的异质性。使用CellphoneDB测定内皮细胞和肿瘤细胞之间的配体-受体相互作用。大多数内皮细胞和肿瘤细胞亚型与大量配体-受体对相互作用,特别是在Endo cells 3中(图6C-D)。ITGB1和VEGFA在内皮细胞与肿瘤细胞的相互作用中发挥了重要作用(图6E-H)。
免疫细胞在ccRCC组织中所占比例较高,约占所有细胞的64.7%(图2D),可分为13种细胞类型(图7A)。在肿瘤微环境中,免疫细胞的相互作用非常密切,特别是TAM 1、DCs和增殖性CD8+ T细胞(图7B-C)。CD74-MIF,CD74-COPA和CD74-APP配体-受体对在TAM和其他免疫细胞中发挥着重要作用(图7D)。
T细胞是ccRCC中最丰富的免疫细胞,可分为5种细胞亚型(图7E)。PD-1是免疫检查点的一个关键受体,它可能对免疫治疗的效果很重要。PD-1在ccRCC中的阳性率约为21.49%(图7F)。ccRCC中,巨噬细胞主要以TAM的形式存在。TAM在ccRCC中可分为两种细胞亚型,一种亚型CD163、CSF1R和CD86基因高表达,另一种亚型则低表达这些基因(图7G)。接下来,分析了TAM 1和TAM 2与所有肿瘤细胞亚型之间的相互作用。TAM与肿瘤细胞之间的细胞相互作用非常密切,尤其是TAM 1(图7H-I)。除了CD74-APP和CD63-TIMP1常见的配体-受体相互作用外,还发现了SLC40A1-CP。SLC40A1是TAM的标志物,而CP是ccRCC肿瘤细胞的标志物。因此,SLC40A1-CP结合的生物学效应值得进一步研究。
虽然已有研究构建了肾细胞癌免疫细胞的染色质动态单细胞图谱,但更全面的包括肿瘤细胞在内的ccRCC单细胞染色质可及性图景可能揭示肿瘤细胞的调控特征。作者通过10x Genomics平台对19个ccRCC样本进行了scATAC-seq。基于LSI算法,将细胞分为29种不同的细胞类型,并确定了每种细胞类型的样本来源(图8A-B)。细胞注释首先计算了肿瘤细胞、内皮细胞、CAF、免疫细胞、CD4+ T细胞、B细胞内皮细胞和NK细胞的标记基因活性评分。随后,分析细胞类型特异性峰,然后确定这些峰对应的基因区域(图8C,D)。在此基础上,相对可靠地定义了ccRCC中29种不同的细胞类型。
通过scATAC-seq鉴定了所有细胞类型的共同可及染色质区域(图9A)。这表明它们的调节过程不是细胞类型特异性的。因此,通过识别细胞类型特异性的共可及染色质区域,可以发现细胞类型特异性的调控过程。此外,scATAC-seq结果显示,非肿瘤细胞的染色质可及性在个体间是一致的(图9B)。每种细胞类型都具有良好的样本普适性,几乎来自所有样本。然而,肿瘤细胞可以根据染色质可及性分为16种细胞亚型(图9C)。大多数肿瘤细胞亚型来源于单个ccRCC样本(图5C)。ccRCC中肿瘤细胞染色质可及性存在显著的个体间异质性。
CA9和KRT14作为ccRCC细胞中可达区域的标记,在每种肿瘤细胞亚型中保持染色质可及性(图9D-E)。为了更好地发现肿瘤细胞亚型之间的异质性,富集了16种细胞亚型的前10个染色质可及区域,并将这些区域映射到基因。发现这些染色质可及性区域既重叠又不同,呈现不规则状态。这也可能表明ccRCC在DNA水平上的遗传易感性。
四种lncRNAs(RP11-661C8.2,CTB-32H22.1,CTB-164N12.1和RP11-267A15.1)可被scATAC-seq特异性地接触到(图10A)。所有这些lncRNAs都有一个位于5号染色体上(图10A)。通过各种机制,顺式作用的lncRNA已被证明可以激活、抑制或以其他方式调节靶基因的表达。证实了ccRCC具有5号染色体拷贝数增加的特征,作者推测这些lncRNAs可能在ccRCC中发挥特异性的调控作用。
作者选择了两种lncRNA(RP11-661C8.2和CTB-164N12.1)进行后续实验,验证了这两种lncRNA的生物学功能。首先,通过细胞质/核分离实验,证实了这两种lncRNAs在细胞核中表达。本研究构建ASO-5608特异性干扰RP11-661C8.2的表达,ASO-5717干扰CTB-164N12.1的表达,反向验证其生物学功能。以ccRCC细胞系786-O和Caki-2为细胞模型。ASO-5608和ASO-5717处理48h后,与NC组相比,786-O和Caki-2中RP11-661C8.2和CTB-164N12.1的表达明显降低。这一结果也表明ASO-5608和ASO-5717的抑制作用是可信的。
接下来,在ccRCC细胞系上进行5-ethynyl-2′-deoxyuridine(EdU)检测。ASO处理后ccRCC细胞系的增殖活性明显降低(图10B)。CCK-8实验也支持该结果(图10C)。随后,进行细胞划伤实验,观察ccRCC细胞系在被划伤0、24、48h后的创面愈合情况。NC组的创面愈合情况优于ASO治疗组(图10D-F)。此外,通过transwell实验观察ASO处理后ccRCC细胞系迁移功能的变化。ASO处理后786-O和Caki-2 w e的迁移显著降低(图10G-H)。上皮细胞-细胞粘附分子钙粘蛋白1(E-cadherin)是一种生长和侵袭抑制因子,已知其通过复杂机制抑制致瘤性和肿瘤扩散。通过免疫印迹试验发现ASO处理后,ccRCC细胞系中E-cadherin的表达明显升高(图10I)。上述结果证实了RP11-661C8.2和CTB-164N12.1在体外促进ccRCC侵袭迁移的作用。
基于以上结果,确认了RP11-661C8.2和CTB-164N12.1的部分功能。然而,这些lncRNA的调控机制仍不清楚。首先获得了与RP11-661C8.2和CTB-164N12.1相互作用的荧光蛋白。然后,对这两种蛋白质进行了蛋白质质谱分析。通过使用Proteome Discoverer软件分析质谱结果,只保留可信的肽段和蛋白,并进行FDR验证,去除FDR大于1%的肽段和蛋白。其中TPM1、TPM4、MYH9、HSPB1、CNBP、MYL6、PUF60和KRT8等蛋白最为显著(图10J)。随后,编码这些蛋白质的基因根据scRNA-seq数据估计它们在每个细胞亚型中的表达。这些基因在CAF和Endo cells 3中几乎高表达(图10J)。一些基因,如TPM1、HSPB1和KRT8在肿瘤细胞中高表达(图10J)。这表明RP11-661C8.2和CTB-164N12.1的调控功能具有细胞类型特异性,主要调控CAF、内皮细胞和肿瘤细胞。
scATAC-seq的另一个优势是可以发现特定的调控过程,特别是TF。在这项研究中,作者发现SPIC和EOMES分别是B细胞和NK细胞中的特异性TF。ZEB1作为一种TF普遍与肿瘤细胞结合,而ETV4普遍与非肿瘤细胞结合(图11A)。此外,scATAC-seq鉴定了内皮细胞、CAF和T细胞的特异性TF和motif(图11A)。每种细胞类型中最显著的前10个TF,这些TF具有细胞类型特异性,特别是在肿瘤细胞和免疫细胞之间(图11B)。
为了预测这些细胞类型特异性TF的确切结合位置,进行了TF足迹分析(图11C)。TF肝细胞核因子1β(HNF1B)是发育性肾病最常见的单基因病因。据报道,HNF1B也与一种罕见的RCC有关,其机制尚不清楚。
基因表达的调控是一个非常复杂的过程,受表观遗传调控、lncRNA、增强子、启动子等因素的影响。作者将scATAC-seq和scRNA-seq的结果进行整合,旨在发现ccRCC的调控规律。构建了单细胞染色质可及性和单细胞转录组co-embedding图(图12A)。虽然单细胞转录组和单细胞染色质可及性的数据上存在差异,但从空间投影可以看出,相同细胞类型之间的分布非常相似。
然后,通过整合scATAC-seq(16个亚型)和scRNA-seq(4个亚型)中的所有肿瘤细胞,发现肿瘤细胞亚型中染色质可及性和基因表达之间的相关性(图12B)。ccRCC 1(scRNA-seq亚型)的基因表达与15种肿瘤细胞类型(scATAC-seq亚型)的染色质可及性相关,这表明了肿瘤细胞调控的复杂性(图12C)。还有ccRCC 2 (scRNA-seq亚型)和ccRCC 11 (scATAC-seq亚型),这意味着染色质可及性和基因表达之间的对应关系(图12C)。ccRCC 2和ccRCC 11主要来源于同一样本。因此,由ccRCC 11的可及染色质区调控的ccRCC 2基因表达特征是准确的(图12D)。然而,ccRCC 1 (scRNA-seq亚型)的调控特征是复杂的,包括15种scATAC-seq肿瘤细胞亚型的调控特征(图12E)。所有15种肿瘤细胞亚型中发现了几个常见的可及染色质区域(图12E)。其中'chr11-111906243-111914666'和'chr5-178286237-178290844'分别位于DLAT和ZNF354B上。在TCGA ccRCC队列中,DLAT信号的低表达与患者总生存期的降低有关。'chr19-10352456-10354286'和'chr7-73829891-73835325'出现在DNA非编码区,它们分别与MRPL4和CLIP2的位置接近。这些发现表明,ccRCC肿瘤细胞的可及染色质区域存在个体差异,并且存在共同的调控区域。
作者通过scRNA-seq从19个ccRCC样本中捕获了102,723个高质量的单细胞转录组信息。通过整合单细胞转录组和全外显子组测序结果,作者发现突变和非突变肿瘤细胞中的基因表达非常相似。这也表明,ccRCC中单个突变基因并没有引起肿瘤细胞所有基因表达的巨大变化。肿瘤免疫微环境中发现了一个特殊的配体受体对(SLC40A1-CP),主要是TAM与肿瘤细胞相互作用。scATAC-seq揭示了细胞类型甚至单个细胞的表观遗传调控特征。作者发现lncRNAs上有一些染色质可及区域具有肿瘤细胞特异性。此外,实验也证实了这些lncRNAs能够促进ccRCC在体外的侵袭和迁移。基于scATAC-seq发现的这些lncRNAs,通过蛋白质谱进一步寻找结合蛋白,从而了解其调控机制。