肺癌异质性分析还能发18+
利用单细胞数据分析肺癌中细胞组成的文章日益增多,但只要找好研究角度仍然可以发高分文章。今天分享一篇一月份发表在Signal Transduction and Targeted Therapy(IF=18.187)的文章,通过整合单细胞测序数据和其他组学数据,揭示肺癌生存相关的细胞和转录模块。
一 研究背景
肺癌在世界范围内仍然是恶性肿瘤相关死亡的主要原因,其病因和生物学上的异质性是导致治疗失败和预后不良的重要原因。肺癌分为非小细胞肺癌(non-small cell Lung cancer, NSCLC)和小细胞肺癌(small cell Lung cancer, SCLC)。NSCLC占肺癌病例的85%,主要由肺腺癌(LUAD)和肺鳞癌(LUSC)两种亚型组成,这两种亚型是根据肿瘤的临床和组织学特征确定的。遗传、表观遗传和微环境特征可以影响细胞程序并导致不同的NSCLC发病机制。由于潜在的异质性,统一的治疗策略可能会失败,导致预后不良。LUAD和LUSC之间的异质性和细胞组成的差异,以及这些细胞组成在多大程度上影响患者的生存仍在很大程度上有待探索。因此,更好地理解肺癌异质性的各种来源,包括遗传、表观遗传、细胞和微环境特征,是一个具有广泛治疗意义的关键目标。
本文作者使用了一种综合的方法来了解NSCLC的异质性,结合了LUAD和LUSC患者在多个肿瘤阶段的scRNA-seq,bulk RNA-seq、全基因组测序(WGS)和ATAC-seq数据集。通过scRNA-seq确定了已知存在于肺癌中的各种细胞类型,包括II型肺泡细胞(AT2)、基底细胞和各种骨髓和淋巴细胞。揭示了主要肺癌亚型中不同的细胞组成,并确定了与预后不良有关的亚组。研究发现,LUAD和LUSC在AT2和基底细胞亚群中有选择性的扩增,并且具有与肺癌低生存率相关的独特的细胞组成模块。恶性和阶段特异性基因分析进一步揭示了肿瘤进展中的关键转录因子和基因。此外,在AT2和基底细胞中发现了具有增殖和分化特性的亚簇。亚簇标记AQP5和KPNA2等10个基因的过表达分析进一步揭示了它们的功能,为肺癌的早期诊断和治疗提供了潜在的靶点。
二 主要结果
构建LUAD和LUSC的多组学图谱
为了全面了解NSCLC的细胞类型组成和转录谱,作者生成了LUAD和LUSC的单细胞和多组学图谱。在华西医院(WCH)的32名未经治疗的患者中,共获得52个新鲜的手术切除的肺部肿瘤和邻近组织,包括11个配对的原发和邻近LUAD样本,8个未配对的LUAD和2个邻近样本,以及9个配对的原发和邻近LUSC患者和2个额外的原发LUSC样本,共21名肺腺癌和11名鳞癌患者(图1a, b)。共有220716个细胞通过质量控制,其中127593个细胞来自肿瘤组织,93123个细胞来自相应的邻近肺组织。总共检测到17277个基因,平均每个细胞1424个基因,突显出该数据集的高质量。作者还整合了之前的数据集,包括全基因组测序(WGS)、ATAC-Seq和bulk RNA测序,这些数据来自45名肺癌患者(图1b)和4名良性肺肿瘤患者的独立队列。总之,作者构建了LUAD和LUSC在体分辨率和单细胞分辨率上的多组学图谱。
为了定义每个细胞类型,作者使用Seurat 和Harmony 来处理293,432个细胞,进行质量控制、归一化、批量效应校正和聚类。所有的细胞都通过UMAP进行可视化,并根据已知群体的标志性基因的表达水平聚类到特定的细胞类型,每个样本都显示出细胞组成的差异。作者在LUAD和LUSC的肿瘤和邻近组织中确定了17个主要的细胞群(图1c,d),每个细胞类型平均有5050个独特的转录本(图1e)。分类后的细胞群可分为两组,非免疫细胞,包括基底细胞(Basal)、肺泡II型细胞(AT2)、肺泡I型细胞(AT1)、纤毛细胞(Cilia)、俱乐部细胞(Club)、内皮细胞(EC)、成纤维细胞(Fib)和神经内分泌细胞(NE)。其余的细胞是构成肿瘤免疫微环境的九个免疫细胞群,包括B细胞(B)、CD4+T细胞(CD4)、CD8+T细胞(CD8)、树突状细胞(DC)、粒细胞(Gran)、肥大细胞(Mast)、巨噬细胞(Mφ)、自然杀伤细胞(NK)和调节T细胞(Tregs)(图1f)。最后,根据第八版肺癌TNM分类法对其原发病人的分类,将每个细胞群分配到肿瘤阶段。来自早期阶段(I期和II期)的细胞占LUAD的63.2%,而LUSC约87%的细胞来自早期阶段的样本(图1g)。总之,scRNA-seq分析发现了LUAD和LUSC的多种免疫和非免疫细胞类型,揭示了肿瘤内异质性和不同亚型肺癌的肿瘤微环境。
绘制非小细胞肺癌恶性细胞异质性
为了审视NSCLC恶性细胞的瘤间和瘤内异质性,首先将细胞分为恶性和非恶性细胞类型(图2a)。对于每种细胞类型,使用inferCNV根据每个染色体区域100个基因的平均表达推断出拷贝数变异(CNV)。例如,我们在LUAD患者的AT2细胞中发现了大规模的扩增,如CD74、RPS14、GPX3、Chr5的TNIP1、CSNK1D、CD7、CYBC1、NARF、FPXK2、Chr17的TBCD,以及Chr19的MED16、CFD、PTBP1(图2b),与WCH7和TCGA数据集的WGS标志一致。接下来,作者比较了恶性细胞与非恶性细胞的比例。在LUAD和LUSC中占优势的恶性细胞分别是AT2和基底细胞(图2c,d),表明AT2和基底细胞在肺癌异质性形成中的重要性。根据推断的CNVs,作者将每种细胞类型分为亚克隆(图2e,f)。为了进一步确定每个亚克隆的关键驱动基因和潜在的治疗目标,作者计算了具有关键临床价值的基因的扩增情况,包括EGFR、KRAS、BRAF、ERBB2和MET。例如,作者发现在AT2的2号和7号亚克隆(图2g)和AT1细胞的1号亚克隆、NE细胞的5号亚克隆中,EGFR的扩增达到峰值。这些亚克隆的大部分细胞来自LUAD患者,这与AT1可由成熟的AT2细胞通过EGFR- KRAS途径更新的观点一致(图2g)。此外,与传统的细胞毒性疗法相比,靶向治疗显示出更好的无进展生存期(PFS)和更高的客观反应率(ORR),并且发现EGFR扩增与TKI疗法的敏感性有关。作者还发现MET扩增在基底细胞的3号和6号亚克隆中富集,这些细胞主要来自LUSC患者(图2h),这与MET作为LUSC的预后作用可以促进肿瘤表型的进展相一致。总之,结果表明AT2和基底细胞的特定亚克隆可能是肺癌中EGFR和MET的潜在治疗目标。
确定循环细胞组成模块
为了全面体现恶性细胞的瘤内异质性,作者在scRNA-seq中确定了细胞组成,然后试图从bulk RNA-seq中发现大队列中反复出现的细胞组成模块。首先根据scRNA-seq中LUAD和LUSC的所有非免疫细胞的组成对样本进行了分级聚类。值得注意的是,LUAD和LUSC倾向于聚在一起,表明这两个亚型有不同的细胞组成(图3a)。为了验证这一观察,作者试图从大型队列中评估肿瘤和正常肺的RNA-seq的细胞组成,包括TCGA(n=1116)、WCH RNA-seq(n=49)、东亚人组(n=260)、CHOICE(n=490)和GTEx(n=427)。由于大体积样品由各种细胞类型的异质混合物组成,作者开发了一个去卷积工作流程inferCC(根据scRNA-seq表达特征推断细胞组成)来评估不同细胞类型的相对比例(图3b)。作者发现,尽管LUAD、LUSC和正常肺的大量RNA-seq来源不同,但细胞组成高度一致(Pearson相关性r>0.8,图3c)。事实上,细胞组成可以区分WCH(图3d)、TCGA(图3e)和CHOICE中的LUAD和LUSC样本,以及东亚队列中的LUAD和邻近组织。接下来作者通过去卷积方法的曲线下面积(AUC)分析确认了可靠性。基于这些细胞组成,能够使用支持向量机(SVM)对肺癌亚型进行正确分类,准确率很高(图3f,AUC=0.89,SD=0.01),表明inferCC解卷的细胞组成可用于肺癌患者的分类。综上所述,分析显示LUAD和LUSC拥有不同的细胞组成,这在形成其异质性方面发挥了重要作用。作者进一步确定,基底是LUAD和LUSC之间异质性的主要来源之一,而成纤维细胞和NE是区分两个肿瘤亚型和其邻近组织的关键细胞类型,表明这些细胞类型在NSCLC中具有重要意义(图3g)。接下来,作者试图根据LUAD和LUSC的细胞组成来确定其亚组。在LUAD中,确定了四个组。AT2-high、Fib-high、AT1-high和NE-high(图3h)。这四个亚型在TCGA队列中得到进一步证实(图3i)。值得注意的是,在TCGA中,被归类为Fib-high的患者与LUAD的预后不良有关(P = 0.016,对数检验,图3l)。在LUSC中,发现了四个主要组别:basal-high、fib-high、AT2-high和NE-high(图3j),并利用TCGA队列进行了验证(图3k)。 重要的是,作者发现AT2-high(P = 0.0043,对数检验,图3m)可以促成LUSC的不良生存。这一部分的结果表明,特定的细胞组成可能对预测肺癌的预后有重要的潜在价值。
修饰LUAD和LUSC的细胞间相互作用
细胞间相互作用的改变在肿瘤进展中起着重要作用。为了阐明NSCLC两种亚型中每种配体受体相互作用的重新分布,作者进行了细胞间相互作用(CCI)分析,并根据CellPhoneDB计算每种细胞类型中受体配体的数量。包括AT2和Fib细胞在内的非免疫细胞类型的细胞间相互作用在LUAD和LUSC之间发生了转变(图4a)。相比之下,免疫细胞的细胞相互作用在两个亚型之间没有明显的变化。结果强调了免疫和非免疫细胞以及NSCLC两个亚型之间的细胞相互作用的差异。鉴于LUAD的Fib-high、AT2-high和LUSC的Basal-Fib hybrid与预后不良有关,作者接下来关注AT2和成纤维细胞在LUAD和LUSC的CCI。结果显示,与邻近组织相比,LUSC和LUAD的CCI明显增加(图4b, c)。此外,GO注释表明,AT2、Fib和Mφ之间的配体和受体在白细胞迁移、激活和肽基酪氨酸相关通路中富集(图4d,e)。例如,作者发现酪氨酸激酶受体TYRO3和GAS6、免疫抑制受体LILRB2和HLA-F之间的受体配体配对特别发生在LUSC的AT2细胞中(图4f),而AXL和GAS6之间的相互作用在LUAD的成纤维细胞中观察到,但在其邻近组织中没有(图4g),与它们在NSCLC中的潜在功能一致。事实上,以前的研究发现,TYRO3和GAS6可能促进Mφ极化为促进肿瘤的M2表型,而LILRB2也与在NSCLC中可以促进肿瘤浸润的髓细胞极化为炎症表型有关。这一部分的结果显示,LUAD和LUSC的CCI增加,一些受体配体配对可能在NSCLC中发挥功能作用。
恶性和阶段特异性基因改变
为了揭示基因表达变异与肿瘤内/肿瘤间异质性之间的关系,作者对LUAD和LUSC中每种细胞类型的恶性和非恶性细胞进行了差异表达分析。与非恶性细胞相比,恶性细胞中有数千个差异表达基因(DEGs)。值得注意的是,AT2、基底细胞、NE细胞在恶性细胞中具有最高数量的上调或下调基因(图5a)。为了确定两种亚型共有的上调基因,作者比较了不同细胞类型中亚型特异性和共同DEGs的百分比。例如AT2和NE细胞的DEGs中只有20%和8.93%的LUAD和LUSC共有基因(图5b)。作者进一步构建了一个基于上调基因的TF调控网络。家族特异性肿瘤抑制因子NKX2-1被鉴定为LUAD中AT2细胞的关键调控因子之一(图5c),该网络揭示了S100A13,一个参与钙结合和细胞周期进程的基因,受NKX2-1的调控。事实上,与良性孤立性肺结节(BSPN)相比,S100A13在LUAD中转录起始位点(TSS)附近有更高的ATAC-seq峰。与恶性AT2的高表达相一致(图5d)。在LUSC的网络分析中发现了包括KLF5和MYC在内的关键的基底细胞TF,其在肺癌患者中的扩增和过表达与之一致,是早期肿瘤的预后标志。接下来,作者对恶性细胞上调基因进行了GO和DOSE分析。在LUAD中,AT2细胞富集了来自未折叠蛋白反应、免疫细胞和mRNA代谢过程调控的基因。在LUSC中,基底细胞富含免疫反应、蛋白折叠、I型干扰素、白细胞和细胞活化。
为了研究肿瘤阶段性的调节,作者对每种细胞类型进行了差异基因表达分析(DEG),进一步构建了AT2(LUAD)和基底(LUSC)细胞的基因模块。结果发现在I期患者的细胞中有许多与肿瘤相关的基因,包括LUAD的AT2细胞中的PIGR、AZGP1、BTG2、EGR1和LMO3(图5e),以及LUSC的基底细胞中的AQP3、SPHK1、PPT1和PDIA6(图5f)。最后,作者探讨了恶性细胞中的上调基因S100A13和LUAD中AT2的阶段I上调基因AZGP1以及LUSC中基底细胞的PPT1的潜在功能。S100A13是S100钙结合蛋白的一个成员,在细胞周期进展和膜通透性方面发挥作用。AZGP1在脂质动员中发挥重要作用,并有助于恶性肿瘤相关的恶病质,而PPT1编码的小糖蛋白通过从半胱氨酸残基上去除硫酸盐连接的脂肪酰基而参与脂质分解。此外,S100A13(P=7.29e-4,t检验)、AZGP1(P=6.31e-4,t检验)和PPT1(P=1.18e-4,t检验)的过表达,显著增加了肺癌H1299细胞的增殖(图5g)。此外,转孔实验也证实AZGP1、S100A13和PPT1增强了H1299细胞的迁移和侵袭能力(图5h ,j),表明这些基因的致癌作用。综上所述,研究结果确定了LUAD和LUSC的转录组改变,并揭示了AZGP1、S100A13和PPT1基因在肿瘤发生中的潜在功能,这些基因在早期DEGs中被发现,表明它们是早期诊断和治疗的潜在生物标志物和目标。
LUAD中AT2子簇的明显特征
为了进一步了解LUAD中关键AT2细胞的亚簇,作者重点研究了21465个恶性AT2细胞及其5个亚簇。簇1、2和4的细胞主要来自早期(I和II期)肺癌患者,而簇3和5的细胞主要来自晚期(III和IV期)患者(图6a)。为了说明AT2细胞的转录轨迹,作者使用URD进行了假时间分析。推断拟时间结果反映280个细胞之间的阶段(图6 b, c)。这些结果符合stage-specific基因模块(图5 e), 表明AT2早期和晚期的病人之间的细胞转录组差异。为了评估每个亚群的生物学功能,作者将每个亚群的标记基因与来自人类肺单细胞图谱的标记基因进行比较,其中11个基因被分为AT2一般和AT2信号选择性(AT2-s)、AT1一般标记基因和亚群特异性基因。有趣的是,作者观察到正常和恶性AT2细胞之间有一些一致的表达模式。AT2通用标记显示在所有集群广泛表达 (图6 d)。值得注意的是,AT2-信号通路(AT2-s)基因,包括WNT通路的配体(WNT5A)、调节蛋白(CTNNBIP1)共受体(LRP5)和转录因子(TCF7L2),据报道与罕见的WNT活性AT2细胞亚群同源,可能是肺泡干细胞。簇1、2、3和4倾向于AT2信号基因的高表达,而簇5中AQP5、AXIN2和GSTA1的表达最低(图6d)。在比较簇间的干细胞得分时,簇5具有干细胞潜能的细胞比例与其他簇相比相对较低(图6e),这表明不同肿瘤分期的细胞具有不同的干细胞潜能的细胞组成。接下来,作者比较了这些亚群中预后生物标志物、药物靶点(图6f)和可靶向突变(图6g)的基因表达水平。它们在簇5中的表达相对较高,表明目前的预后标志物和药物局限于晚期分化细胞的基因,而不是针对肿瘤早期的增殖簇。为了研究增殖集群标记基因的功能含义,作者评估了七个基因,包括一般标记(ANXA1),集群1(AQP5,ATF3,AZGP1和CHI3L1),集群2(SPINK1)和集群4(EFF1A2)。ANXA1在所有集群中都有高表达。作者通过免疫荧光染色实验验证了ANXA1蛋白在LUAD肿瘤和正常组织中的表达,ANXA1的过表达表明它可能通过增强增殖来促进肿瘤的发展。更重要的是,与正常对照组相比,AQP5的免疫荧光染色以及AT2标记物SPB在LUAD肿瘤组织的AT2细胞中上调(图6h),并且AQP5在肺癌H1299细胞中的过度表达增强了增殖(图 6i,P=1.13e-4,t检验),高水平的AQP5与较好的预后(图6j,P=0.045)和肺癌细胞的侵袭能力有关,表明AQP5有促进肿瘤的作用(图6k,l),与它通过诱导上皮间质转化(EMT)过程促进肿瘤发生的作用一致。根据过表达实验结果,集群1(ATF3、AZGP1和CHI3L1)、集群2(SPINK1)和集群4(EFF1A2)的其他标记物也被发现可以促进肿瘤的发生。总之,作者在恶性AT2细胞中发现了一些具有明显特征的簇,其中一些类似于增殖细胞(簇1-4),而另一些(簇5)则倾向于第三期患者的分化,实验验证的六个标记基因可能具有潜在的临床价值。
LUSC基底细胞分化亚群
基于细胞模块的分析,基底细胞被证明是LUSC的关键细胞类型之一。为了确定基底细胞亚群的特征,作者集中研究了8202个恶性细胞,这些细胞可分为七个群。聚类1、3、4和7主要由来自早期(I期和II期)患者的基底细胞组成,而聚类5和6是不同阶段的混合体,聚类2则全部来自III期(图7a)。在伪时间分析中,来自II期的细胞与I期和III期的细胞有偏差(图7b,c),这与II期有最多的阶段性特异基因相一致(图5f)。为了了解每个集群的生物学特性,作者将集群特异性基因(图7d)与人类肺细胞图谱中的基因进行比较。结果发现,基底的一般标志物在所有集群中广泛表达,而近端基底的标志物(Bas-px)在集群7中高度表达,分化基底的标志物(Bas-d)在集群3中选择性表达(图7d)。值得注意的是,集群4选择性地表达了增殖基底(Bas-p)的标志物,包括MKI67、TOP2A、PBK和GTSE1。作者进一步利用干性和细胞循环得分,发现第4簇的干性得分最高,主要被归类为循环细胞(图7e,f),表明该簇可能具有增殖细胞的特征。最后,作者通过实验研究了集群4的特异性KPNA2(karyopherin alpha 2)和集群7的PPT1。与正常肺组织相比,通过免疫荧光染色观察到肿瘤组织中KPNA2蛋白的表达增加(图7g)。综上所述,这部分结果揭示了类似于正常肺细胞亚群的恶性细胞群和一个(群4)在恶性基底细胞中具有干性增殖的特征,KPNA2可能促进LUSC的肿瘤增殖。
三. 总结
综上所述,本研究结合多组学分析建立了肺肿瘤图谱,并广泛研究了LUAD和LUSC之间的异质性变化,为了解肺癌亚型之间肿瘤进展的独特机制提供了有价值的资源。为肺癌的早期诊断和治疗提供了蓝图。
参考文献
Zhang, L., et al., Integrated single-cell RNA sequencing analysis reveals distinct cellular and transcriptional modules associated with survival in lung cancer. Signal Transduct Target Ther, 2022. 7(1): p. 9.