导读
遗传学中心法则表明,遗传信息在精密的调控下通过信使RNA(mRNA)从DNA传递到蛋白质。因此,mRNA被认为是DNA与蛋白质之间生物信息传递的一个“桥梁”,而所有表达基因的身份以及其转录水平,综合起来被称作转录组(Transcriptome)。转录组是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的总和,主要包括mRNA和非编码RNA(non-coding RNA,ncRNA)。本文的作者利用高通量测序数据识别急性髓系白血病(AML)的生物学相关的分子亚型,并基于组学的对相关靶向药物进行筛选。
研究背景
AML是一种髓系肿瘤,其临床过程和治疗反应具有高度异质性。由于细胞遗传学、分子生物学和下一代测序(NGS,又称高通量测序技术)技术的进步,越来越多的预后标志物和治疗靶点被确定下来。AML的分类已从French-American-British (FAB)形态学分型转向更精细的WHO分类系统。此外,新的靶向药物的出现,如FLT3、BCL2和IDH1/2抑制剂,提高了AML患者的长期生存。2010年以来,在AML和其他急性白血病中进行了一些基因组和转录组学研究。癌症基因组图谱(TCGA)项目解剖了AML的基因组图谱,并提出了9类突变基因。另一项里程碑式的研究仅根据遗传异常推荐了11类不同的AML。然而,4%的AML患者符合两类或两类以上的标准,11%仍未分类,5%没有携带驱动突变。因此,迫切需要开发和整合基因组改变以外的更多信息,以进一步完善疾病的分类和治疗策略。所以我们仍然需要开发和整合基因组改变之外的更多信息,以进一步完善疾病的分类和治疗策略。
研究思路
基于对RNA-Seq数据的共识聚类分析,作者确定了AML中八个稳定的亚组(G1-G8)。T转录因子融合PML::RARA、CBFB::MYH11和RUNX1::RUNX1T1分别聚类为G1、G2和G3亚组。G4亚组中几乎全部病例发生biCEBPA突变,另外有8例moCEBPA突变杂合度缺失(LOH)和11例CEBPA野生型(WT)病例,称为biCEBPA/-like。相比之下,G5-G8亚群缺乏单一的亚群定义分子。G5亚组的特征是由AML、骨髓增生异常相关(AML-MR)组成,因此该亚组被命名为骨髓增生异常相关/样(MR/-like)。G6-G8亚群包含NPM1突变、KMT2A和NUP98融合和分化实体,表明这些基因定义的亚型具有相对较高的异质性(图1)。
与G1-G4相比,G5-G8亚组HOXA/B、MEIS1和钙依赖CPNE8基因表达水平更高,这是两者之间最显著的差异。与DNA甲基化基因、染色质修饰因子和剪接体的相关的基因突变在G5-G8中显著富集,这与老年患者、中高风险(欧洲白血病网 (ELN))以及这些亚组中出现更多的复发和死亡一致。G5亚组主要包括RUNX1、TP53、PHF6和“继发性”突变(ASXL1、BCOR、EZH2、STAG2、U2AF1、SRSF2、SF3B1和ZRSR2),这些突变通常在骨髓增生异常综合征(MDS)转化的AML中富集。G5组患者的核型、单染色体核型更加复杂,5、7、17号染色体异常,诊断时骨髓(BM)母细胞和白细胞计数(WBC)较低。同时,罕见的IKZF1、N159S热点突变也聚集在G5亚组,而其他IKZF1突变大多数与biCEBPA同时发生,属于G4亚组。最后三个亚组(G6-G8)聚集了更多的NPM1突变、KMT2A和NUP98融合、FLT3-ITD和KMT2APTD。值得注意的是,G8亚组中DNMT3A/NPM1/FLT3-ITD三联突变频率较高,在G6、G7和G8中则出现较少。而G7亚组中TET2或IDH2与NPM1/FLT3-ITD突变更为常见,分别占G6、G7和G8的0、28.4%和7.4%。作者排除了X/Y染色体上的基因,但与其他亚组相比,G7和G8亚组中的女性患者更多(图2)。
接下来,作者试图破译已知和未被报道亚群的转录组失调特征。考虑到细胞形态学是显示细胞分化阶段的传统诊断方法,作者首先将基因表达亚群与FAB分类系统进行比较。结果表明,G1 (PML::RARA)、G2 (CBFB::MYH11)、G3 (RUNX1::RUNX1T1)和G6分别对应于t(8;21)易位的M3、M4、M2和M5(FAB命名法)。G4 (biCEBPA/like)亚组以M1/M2/M4为代表,G5 (MR/ like)以AML/M2/M4/M5为代表,G7主要以M2/M4为代表,G8以M4/M5为代表。此外,不同的分子亚型表现出不同的免疫细胞丰度。G2和G6中单核细胞和巨噬细胞较多,与FAB分类一致。
同时,作者参考了相关的单细胞RNA-Seq (scRNA-Seq)数据,以确定不同分化状态的基因特征,其中包括造血干/祖细胞样(hspc样)、粒细胞-单核细胞前体细胞样(gmp样)和单核细胞样细胞。通过降维处理,G1 - G8的每个亚型都具有不同的细胞类型特征。在G1-G8中,不同细胞类型的分子标记表达水平不同。为了验证bulk RNA-Seq数据推断的细胞组成,作者利用流式细胞术随机分析了36例G1-G8 AML病例的免疫表型。在G5、G7和G8亚组中,CD34+CD38−成分在总白细胞中的比例明显更高。此外,G1、G3和G4亚组的样本表现出粒细胞分化免疫表型,而G2和G6亚组的样本表现出典型的单核细胞表型。
最后作者评估各亚组的特征基因表达特征。HOXA/B家族基因在G5和G6-G8中分别表现为中表达和高表达。G5、G7和G8中LSC17(白血病干细胞的17基因标志)信号上调。利用已发表的差异表达基因,可以将NMP1突变的AML分为“primitive”亚型和“committed”亚型,G6和G7分别表现出单核细胞谱系特征和干细胞特征,而G8表现出混合特征。因此,它们被命名为HOX-committed (G6,单核细胞),HOX-primitive (G7,干细胞)和HOX-mixed (G8,干细胞和单核细胞分化阶段)。除了这些明确的基因集,作者还描述了各亚群中特征基因和BCL2家族基因的表达水平(图3)。
作者以G1 (PML::RARA)的生存期为参考,显示8个亚组的生存结果。尽管G2 (CBFB::MYH11)、G3 (RUNX1::RUNX1T1)和G4 (biCEBPA/-like)亚组显示了相对较长的总生存期(OS),但这些患者中仍然出现了疾病复发的现象。就OS和无事件生存期(EFS)而言,G5 (MR/ like)和G8 (HOX-mixed)亚组的患者预后最差,而G6 (HOX-committed)和G7 (HOX-primitive)亚组的患者风险略低。考虑到年龄对AML的生存有显著影响,作者将患者分为两个年龄组。对于年龄大于60岁的患者,除少数ELN低风险亚组外,预后均较差。然而,G5和G8均可预测出年轻(≤60岁)AML患者的不良预后。
然后作者探讨了代表性分子在亚群内异质性。在G4亚组中,biCEBPA样基因表达的患者与携带biCEBPA突变的患者具有相似的预后。然而,其他亚组中CEBPA突变(几乎都是moCEBPA)的预后极差。在G5亚组中,携带融合基因(主要是一些罕见的和以前未报道的基因)以及转录因子(TF)、肿瘤抑制因子(TS)和剪接体突变的患者有差的预后。作者探索了一些亚型的发病机制,其中作者将人CYB5A::DYM (G5) mRNA注射到斑马鱼胚胎中,这导致髓系标记物lyz、mpx和lcp1的表达增加。在G8亚组中,与融合基因和NPM1突变的患者相比,有TF突变和其他遗传病变的患者预后更差。为了阐明这些亚组的独立预后价值,作者对非m3 AML患者进行了多变量Cox分析。结果发现年龄、男性、血小板、白细胞计数和LSC17风险评分都是不利预后的因素(图4)。
通过利用基于自动机器学习(AutoML)的建模算法和不同的预处理步骤,可以准确预测8个基因表达亚群,预测精度中位数为0.95。作者选择从BM(骨髓)中收集的新诊断AML样本,并从TCGA LAML队列和Beat AML队列中获得可用数据。基于所建立的模型,两个队列都能重现G1-G8亚群,并显示出相应的表达和分化特征。TCGA LAML队列中预测的G5、G6和G8亚组患者,以及Beat队列中G5亚组患者具有显著不良的临床结果。
基于Beat AML队列的体外药敏数据,各个亚群对不同类型药物具有不同的反应。G1、G4和G5亚组对受体酪氨酸激酶(RTK)的多种抑制剂如Sorafenib、Sunitinib、Quizartinib、Pazopanib等表现出耐药性,而G6-G8亚型对这些药物表现出高敏感性。G2、G5和G6亚组对BCL2抑制剂Venetoclax耐药。作者观察到单核细胞表型(G2和G6)对组蛋白去乙酰化酶(HDAC)抑制剂Panobinostat和RTK抑制剂Dasatinib有明显的敏感性,这两种药物通常用于血液系统恶性肿瘤。综上所述,这些数据证实了定义的基因表达亚群在AML中的临床应用,这可能有助于更合理的治疗,并为开发新的药物提供支持(图5)。
全文总结
本研究作者基于转录组数据,建立了8个AML分子亚群(G1-G8)。每个亚组表现出独特的临床特征、遗传病变和发育等级。该分类系统反映了AML中调节回路的复杂相互作用,并补充和丰富了目前公认的基于基因组的分类方案,从而可能为疾病的发病机制提供创新的见解。此外,本研究的转录组分类显示了预后价值,并提供了亚型特异性药物敏感性信息,这可能有助于AML患者的治疗决策。
参考文献
1. Cheng WY, Li JF, Zhu YM, et al. Transcriptome-based molecular subtypes and differentiation hierarchies improve the classification framework of acute myeloid leukemia. Proc Natl Acad Sci U S A. 2022;119(49):e2211429119. doi:10.1073/pnas.2211429119