人类癌症中增强子甲基化与转录因子调控的极限拉扯
作为连接表观基因组改变与基因表达变化桥梁的增强子,其甲基化与增强子转录、靶基因表达之间的调控关系与人类癌症有着怎样的爱恨情仇?今年6月初发表于《Oncogene》(IF:8.756)的一篇文章则刻画了人类泛癌中增强子甲基化-增强子转录-靶基因表达三元组间的调控模式,其中强调了增强子甲基化驱动的核心转录因子调控回路,这种回路的重连可以作为药物靶点和预后风险标志物。
一、研究背景
越来越多的证据表明,增强子甲基化对基因表达具有强大的动态调控作用。某些转录因子可以通过前馈的方式进行自调节和交叉调节,并与其增强子协同形成核心转录调控回路(CRC)。然而,研究人员对于增强子甲基化和核心转录调控回路之间的详细调控机制的了解只是冰山一角。
二、研究思路
本研究整合公共的TCGA癌症样本与正常样本的基因表达、DNA甲基化以及增强子转录等数据,从以下五个方面开展研究:增强子转录刻画、DNA甲基化对增强子转录的影响、差异甲基化增强子、增强子甲基化-增强子转录-靶基因表达三元组调控模式、增强子甲基化驱动的核心转录调控回路。
三、研究结果
1、增强子甲基化在其转录活性调控中起着重要作用
基于在33种TCGA癌症类型中鉴定得到的12559个转录增强子,作者利用Jaccard系数探究组织或者癌症类型间增强子的转录组相似性,发现具有相似组织起源的癌症谱系聚集在一起,表明增强子转录通常具有组织特异性(图1 A)。作者随后识别差异的增强子,并根据其从正常到癌症的转录改变划分为两类:“升高”与“降低”。在识别的9131个差异增强子中,大多数的增强子都是癌症类型特异的(图1 B)。
进一步,该研究探究DNA甲基化对于增强子基础转录的影响。作者识别增强子甲基化区域以及进一步筛选差异的甲基化增强子(癌症vs 正常),并根据从正常到癌症的甲基化改变将其划分为“去甲基化”、“重新”以及“增强”。结果发现“去甲基化”的增强子在多种癌症类型中占比50%以上(图1C),而且大多数的增强子只在一种或两种癌症中存在差异甲基化(图1 D)。在大多数的癌症类型中,增强子的甲基化程度与其转录活性显著负相关(图1 E),也即大约76.5%的增强子其甲基化程度降低而转录水平增高(“去甲基化-升高”)。这些结果表明DNA甲基化是调控癌症特异性增强子转录活性的重要因素,其中与增强子转录活性增加相关的去甲基化在人类癌症中广泛存在。
图1、人类癌症中增强子的转录与甲基化
2、人类癌症中低甲基化增强子的全局激活
为了了解不同癌症类型中增强子转录和甲基化的多样性和普遍性,作者分别基于增强子的转录和甲基化水平对10种癌症类型的4296个癌症样本进行了一致性聚类分析。基于增强子转录将样本聚成了4个转录亚型(T1,T2,T3以及T4),这4个亚型中增强子转录的平均水平都显著高于正常样本,表明了增强子转录可能在癌症中被全局激活(图2 A,B)。随后,基于增强子甲基化对相同的样本进行聚类导致了4个甲基化亚型(M1,M2,M3以及M4),其中M1的甲基化水平与正常样本相似,并且显著高于M2、M3与M4(图2 C,D)。因此,作者将M1亚型命名为“正常样甲基化”亚型,而M2、M3与M4定义为“低甲基化”。
此外,作者基于累积超几何分布利用甲基化亚型丰富样本的转录亚型,综合定义了6个样本亚群(cluster A-F)(图2 E)。据此,癌症中增强子呈现两种状态:“低甲基化-激活的转录”(cluster A,B,C,D以及F,占总样本的70.5%);“正常样甲基化-激活的转录”(cluster E,占总样本的70.5%)。BRCA与PRAD主要表现为“正常样甲基化-激活的转录”增强子状态,而COADREAD,HNSC、LIHC、LUAD、LUSC、KIRC、KIRP和THCA主要表现为“低甲基化-激活的转录”的增强子状态(图2 F)。这些结果表明低甲基化增强子的全局激活在人类癌症中是一种常见的现象。
图2、癌症样本中低甲基化增强子的全局激活
3、增强子的甲基化改变涉及复杂的基因表达调控模式
为了进一步阐述增强子甲基化相关的调控关系,作者系统性地识别了增强子扰动的靶基因(蛋白编码基因与lncRNAs)以及进一步组装了增强子甲基化三元组(增强子甲基化-增强子转录-靶基因表达)。在三元组中,去甲基化诱导增强子的激活从而上调靶基因表达(“去甲基化”-“升高”-“上调”)的调控关系占比最高(图3A)。其中在LUAD中观测到一个去甲基化的增强子(chr12: 31,902,03 -31,903,126)可以激活增强子基础转录,上调lncRNA DENND5B-AS1的表达,该调控关系进一步在组织水平测序数据以及A549细胞中被验证(图3 B)。DENND5B-AS1共表达基因的功能富集分析结果显示该基因参与DNA损伤修复,而转录因子FOXA1在已有研究中被证实通过诱导DNA去甲基化参与DNA损伤修复机制。确实,在A549细胞中DENND5B-AS1启动子和增强子区域中观测到明显的FOXA1结合峰(图3C)和染色质相互作用。此外,在LUAD中FOXA1表达与增强子的甲基化水平显著负相关(图3D)。实验验证表明FOXA1敲除后,MCF-7细胞中增强子甲基化水平明显恢复(图3E)。这些结果暗示转录因子在主导增强子调控中起到重要的作用。
图3、推断人类癌症中增强子甲基化主导的调控模式
随后,作者提出了四种以增强子甲基化为主的调控模式,以阐明三元组中可能的调控关系:“独立”,“级联”,“协同”,以及“复合”模式(图3F)。独立模式表明DNA甲基化独立调控增强子的基础转录和靶基因的表达,其中包括三个子模式:(1)转录因子和染色质重塑复合物绑定诱导的去甲基化促进了增强子的基础转录,将增强子从平衡状态切换到激活状态(“静态”模式);(2)激活状态增强子的去甲基化增加了转录因子结合概率并影响靶基因的表达(“直接”模式);(3)增强子转录和靶基因都可能对DNA甲基化改变做出响应(“共响应”模式)。级联模式则假设增强子甲基化可以调控其基础转录产生增强子RNA(eRNA),而新生的eRNAs将构成转录起始复合物调控靶基因表达程序。在协同模式中,增强子甲基化和eRNA协同调控靶基因的表达。最后,复合模式则表示增强子甲基化及其所产生的eRNA共同影响靶基因的表达。
其次,作者进一步基于贝叶斯网络与最大似然估计方法来识别每个三元组其数据拟合的调控模式,结果包括3212个“独立”模式,951个“级联”模式,766个“协同模式”以及47个“复合”模式(图3 G)。有趣的是,基于靶基因的功能富集分析结果显示“级联”模式主要富集于免疫反应和发育以及分化;“协同”模式主要富集于细胞周期与信号通路功能术语;“独立”模式主要参与RNA稳定性调节与生殖细胞发育的生物过程(图3 H)。这些结果进一步强调了增强子甲基化驱动癌症进展的可能影响。
图3、推断人类癌症中增强子甲基化主导的调控模式
4、核心转录因子能够塑造增强子甲基化并形成核心转录调控回路
先前的研究表明一些转录因子的占用可以介导调控元件上DNA甲基化的主动转换。因此,作者调查几个能够修饰DNA甲基化的转录因子(MeTFs)对增强子甲基化的影响,例如转录因子RUNX3,CEBPB, CEBPA, GATA2, SOX2以及 FOXA1。这些在癌症中显著表达失调的MeTFs不仅在多个癌症细胞系中观测到其在增强子甲基化区域上表现出很强的结合信号,而且其表达与增强子甲基化水平显著相关(图4A),暗示了转录因子与增强子甲基化间存在紧密的联系。例如,转录因子CEBPB能够结合其增强子区域来调节自身的表达程序(图4B),体外实验已经证明CEBPB可以通过诱导增强子甲基化的改变进行自我调节,从而导致其在癌症中的表达失调。在以往的研究中,这种转录因子自我调节回路也被称为核心转录调控回路(CRC)。
为了进一步探索增强子甲基化对人类癌症CRC的影响,作者系统地识别了增强子甲基化驱动的CRC (emCRCs):首先识别增强子甲基化区域内的超级增强子以及癌症特异的核心转录因子;然后将含有核心转录因子的增强子甲基化三元组定义为是emCRCs;最终识别到33个自调控的核心转录因子,涉及48个emCRCs。在TAMR与WS8细胞中GRHL2在超级增强子与启动子区域上的结合信号支撑了GRHL2可以导致自调控回路(图4C)。此外,TEAD4的过表达可以被下游超级增强子 (chr12:3,068,563-3,070,563)的去甲基化所调控,形成正反馈循环。值得注意的是,与正常细胞相比HCT116细胞的超级增强子区有更强的TEAD4结合信号(图4 C)。作者进一步探究前人研究中实验支持的emCRCs下游基因,结果表明emCRC转录因子能够调控彼此的表达,从而形成一个紧密相连的调控网络(图4 D)。通过注释这些下游基因的功能,结果发现它们参与了癌症进展的多种生物学过程,例如癌症通路,免疫反应,染色质构成,细胞周期以及蛋白质修饰(图4E)。这些结果表明,emCRCs对调控转录重编程和控制癌症过程至关重要。
图4、转录因子参与增强子甲基化调控
5、emCRC的重连接是潜在的治疗靶点
作者进一步探究emCRCs在人类癌症中的临床应用价值。相比于emCRC中单个的增强子甲基化、增强子转录或者转录因子表达,基于COX多元回归计算的各emCRC的风险得分具有最高的预后价值(图5A)。例如,受其自身增强子甲基化调控的核心转录因子E2F8构成的emCRC在LIHC, LUAD,以及LUSC具有最高的预后价值(图5B)。增强子(chr11:2,225,980 -2,227,103)的去甲基化激活增强子基础转录并上调E2F8的转录。据此,作者通过免疫组化(IHC)和免疫荧光(IF)染色观察到癌症组织中E2F8蛋白水平高于正常组织(图5 C,D)。E2F8相关的emCRC的风险得分在LUAD以及LIHC中可以作为风险预后标志物(图5 E)。
在COADREAD, HNSC以及LUAD中核心转录因子ZNF384的上调可以被可以被下游增强子(chr12:13,024,869-13,025,992)的去甲基化所诱导(图5F)。IHC和IF染色也支持结肠癌组织中具有较高的ZNF384蛋白水平(图5G, H)。通过靶向ZNF384的CRISPR干扰处理,在K562细胞中观察到其增强子基础转录显著降低(图5I),暗示转录因子ZNF384可以调控其增强子活性。此外,在HNSC中基于ZNF384相关emCRC定义的风险得分则指示较差的疾病特异生存DSS(图5J)。这些结果表明,emCRC的重连接可以增强ZNF384的表达,而上调ZNF384也可以通过调节其增强子活性形成一个正向的自调控环。
图5、emCRCs的潜在临床应用
6、EmethCRC:用于探索人类癌症中的emCRC的网站服务器
EmethCRC (http://bio-bigdata.tech/EmethCRC/)包含癌症特异的emCRCs和它们的调控关系、emCRCs的潜在临床应用以及实验支撑的emCRCs下游基因。所有结果均可免费下载用于后续分析。
四、小结
文章所有章节都是采用整体描述结合特例分析的手法,全局基调则从增强子甲基化-增强子转录-靶基因表达三元组中逐渐聚焦到增强子甲基化驱动的核心调控回路,最后以核心调控回路的整体动态变化相比于单个元素更能指示癌症的生存完美收官。