自从2006年全基因组关联分析(GWAS)问世以来,已经经历了多个世代,从单队列时代(5000人左右)到多队列meta分析时代(GWAS meta-analysis;1万-10万)和生物库时代(如UK Biobank 50万人)。如今,GWAS已经正式进入了全球多生物库meta分析的新时代,人数也正式来到了百万级别,各类Post-GWAS分析应运而生,是利用公开数据库发表高影响因子文章的非常好的工具之一!如果说十年前Meta分析是大家追捧的对象,那么十年后必然是孟德尔随机化(MR)的时代!
关于Post-GWAS分析的简要介绍,已经在前期与大家分享过,今天我们来讲一讲可以用来对GWAS进行补充的——EWAS!即表观基因组关联分析,来看看表观遗传学变异如何联合GWAS和MR分析关联复杂疾病!
GWAS可以用来鉴定新的基因以及染色体区域,为复杂疾病的致病基因定位提供了强有力的手段,但是越来越多的研究表明,复杂疾病的致病原因是多样化的,基因组遗传信息的变异是导致复杂疾病的重要因素之一,除此之外,表观遗传学的变异在复杂疾病的发生发展中也起到很重要的作用。GWAS 所采用的研究策略仅仅局限于遗传信息的变异,而无法在表观遗传学层面进行复杂疾病的解读。表观基因组关联分析(EWAS)技术的出现弥补了 GWAS 的不足,将表观遗传学变异和复杂疾病进行关联,在表观遗传学层面对复杂疾病的致病原因进行解读,找到与致病原因相关的表观遗传学变异位点。
DNA甲基化(DNA methylation, DNAm)是最常见的表观遗传修饰,它调节基因的表达,具有动态的和组织特异性的特点,在调控染色质结构,基因表达调控和细胞命运决定等关键生物学过程中发挥着重要作用。DNA甲基化具有可塑性,对环境变化和衰老高度敏感,在调控染色质结构,基因表达和细胞周期调节起着关键作用,参与了人类发育、衰老、基因组印记和抑癌基因失活等多种关键生物学过程。
以甲基化发现为目标的多组学EWAS队列研究的两个方向:
EWAS可以检测容易受环境因素影响的新的调控机制:
EWAS可以将在病例全基因组范围内检测出的甲基化变异位点与对照进行比较,找出所有的甲基化位点的变异频率,从而避免了像候选基因策略一样需要预先假设致病基因。同时,EWAS 研究也可以鉴定新的与疾病相关的甲基化位点,为复杂疾病的发病机制在表观层面上提供了更多的线索。
EWAS利于探究对DNA序列变异和DNA甲基化之间关系:
大部分GWAS显著关联位点都落在基因组非编码区。一种可能的解释是,这些易感位点通过调节特定区域的甲基化水平,从而改变个体复杂性状。如果某个位点既对复杂性状有影响,又对甲基化水平有影响,那么该位点就很有可能符合上述解释。共定位分析(Collocalization)正是试图找出这些“共定位”位点。
传统的GWAS是将全基因组范围内的常见变异进行关联分析,鉴定与表型相关的基因座,但鉴定出来的位点大多数位于基因间隔区,其如何通过基因或者通路影响表型很难被阐述,一种可能的解释是,这些易感位点通过调节特定区域的甲基化水平,从而改变个体复杂性状。如果某个位点既对复杂性状有影响,又对甲基化水平有影响,那么该位点就很有可能符合上述解释。共定位分析(Collocalization)正是试图找出这些“共定位”位点。共定位分析方法,属于Post-GWAS的一项重要工作,eQTL和mQTL是EWAS常用的共定位方法,旨在GWAS结果的基础上鉴定与表型相关的eQTL和mQTL位点。SMR利用GWAS的summary数据和表达数量性状基因座(eQTL)的数据,采用SMR和HEIDI方法,以测试基因表达水平与感兴趣的复杂性状之间的多效性关联。
通过这种mQTL分析或者共定位分析,就能找到一些某基因甲基化水平显著相关的SNP位点。这样,以甲基化为中间桥梁,实现了SNP——甲基化——性状的生物学模型。利于探究对DNA序列变异和DNA甲基化之间关系,为和调控中的分子网络、基因变异与人类表型的潜在联系提供了新的见解。同时,研究还揭示了多个新的调控网络,这些发现为支持表型变异的生物学途径提供信息基础。同时,可以进一步行疾病易感性甲基化位点关联分析,药物敏感性甲基化位点关联分析等。
公共数据库,EWAS,GWAS和MR分析!每一个都是热门的研究方向!这几个学术界的“香饽饽”的会碰撞出怎么样的火花呢?请关注下期内容吧~