复杂疾病的新思路:甲基化还能这样玩儿?
苦苦寻找新的研究切入点,不如将已有的研究热点“以旧翻新”!今天小编展示一下如何利用公共数据库,通过GWAS和MR分析,玩转“甲基化”!重点:易思路复制,易发高分,易找到研究空白!
文章发表在EBioMedicine IF: 11.20/ Q1 ,题目为“线粒体相关的全基因组孟德尔随机化确定多种癌症类型的推定因果基因Mitochondrial related genome-wide Mendelian randomization identifies putatively causal genes for multiple cancer types”
作者利用孟德尔随机化(MR)分析线粒体相关基因中以遗传易感性为特征的线粒体功能障碍与癌症之间的潜在因果关系,利用基于单核苷酸多态性(SNPs)的性状的遗传关联,将GWAS数据与基因表达和甲基化整合,识别表达和甲基化数量性状位点(eQTL或mQTL)。并证明线粒体功能障碍在多种癌症类型发病机制中的重要性。这些已知的基因可以作为癌症治疗和预防的潜在药理靶点,进一步的研究可以探索潜在的生物学机制细节。
一、背景
线粒体是调节细胞能量产生、代谢、增殖和凋亡的重要细胞器。线粒体功能的改变是癌症的一个众所周知的标志,通常表现为异常的线粒体形态,缺乏线粒体拷贝数,异常的能量代谢,活性氧(ROS)的积累,不平衡的生物发生和线粒体吞噬轻微的线粒体功能障碍可增强癌细胞的扩增和侵袭。除了线粒体本身编码的37个关键生物能量基因外,线粒体相关基因组还包含1000多个额外的核基因,这些基因的遗传易感性可能会导致线粒体功能障碍。
许多实验和流行病学研究试图通过探索选择性线粒体DNA (mtDNA)和线粒体相关的核DNA突变来推断线粒体功能障碍和癌症之间的因果关系,然而,这些研究产生的结果是不一致且没有考虑混杂因素的影响来区分因果。
全基因组关联研究(GWAS)利用基于单核苷酸多态性(SNPs)的性状的遗传关联,并将GWAS数据与基因表达和甲基化整合,GWAS允许识别表达或甲基化数量性状位点(eQTL或mQTL)。基于总结数据的MR (SMR)可以利用独立的GWAS总结统计数据和QTL数据,从GWAS中确定的命中中优先考虑潜在的因果基因。目前还没有MR研究调查线粒体功能障碍与常见类型癌症风险之间的潜在因果关系。
研究旨在通过综合双样本MR分析,探讨线粒体相关基因遗传易感性为特征的线粒体功能障碍与多种癌症类型之间的因果关系。
二、方法
实验设计:从人类MitoCarta3.0数据库中提取1136个已知的线粒体相关基因(图1)。
图1
暴露因素工具变量的选择:1)线粒体的工具变量Cis-eQTL:来自从Gen Consortium 数据库获取eQTL汇总统计数据。 2)线粒体基因甲基化相关的工具变量Cis-mQTL:来自包括了两个公开数据库队列的荟萃分析。共筛选出931,304个SNPs,对应于2550个线粒体相关DNA甲基化CpG位点。3)线粒体相关蛋白表达相关的遗传变异的Cis- pQTL工具变量:从5个蛋白质组数据集中获取,选择了23个线粒体相关蛋白表达密切相关的SNPs(P<5 × 10−8)。
结局指标工具变量的选择:18种癌症的工具变量:来自GWAS癌症的汇总统计数据。
数据分析:包括孟德尔随机化分析(MR),敏感性分析和共定位分析:在使用TwoSampleMR R包完成主要SMR分析后;使用5种附加MR方法进行敏感性分析。使用coloc R包对两个特征的共定位分析,后验概率PP.H4 >0.8为 GWAS和QTL具有显著性关联。
三、结果
线粒体全基因组cis-eQTLs与癌症结局的分析
在SMR测试之后,从血液中获得了662,968个代表线粒体相关基因表达和癌症结果的SNPs(图1),在多重测试后仍显示相关性的强有力的相关性证据(PSMR<4.936 × 10−5 [Bonferroni校正,P<0.05/1013]),HEIDI检验(PHEIDI<0.01)提示相关性是由于共享因果变异。
MR分析:在乳腺癌的7个独特遗传位点上鉴定了7个关联信号,在前列腺癌的4个独特遗传位点上鉴定了4个关联信号,在胃癌上鉴定了1个关联信号。
敏感性分析:证明并支持上述的发现。
共定位分析:排除由于连锁不平衡导致的混杂因素并检测基因表达和癌症之间共享因果变异的后验概率以确定癌症GWAS和eQTL之间是否存在显著的共定位(图2)。
图2
线粒体全基因组cis-mQTLs与癌症结局的分析
MR分析:在乳腺癌的14个独特遗传位点上鉴定出15个关联信号,在前列腺癌的10个独特遗传位点上鉴定出11个关联信号,在胃癌上鉴定出1个关联信号,在肺癌的3个独特遗传位点上鉴定出4个关联信号,在黑色素瘤的1个独特遗传位点上鉴定出2个关联信号(图3)。
敏感性分析:支持相同的关联(图S4和S5)。
共定位分析:调节NSUN4的不同基因变异对甲基化水平有不同的影响,从而导致BU不同的结果。
作者共发现了6个独特的位点,它们调控NUSU4中7个不同CpG位点的甲基化水平,并与乳腺癌的风险呈正相关(图3),这6个位点其中2个也与前列腺癌的风险呈正相关。此外,NUDT5甲基化增加1个SD与前列腺癌风险降低4%相关;对于肺癌,VARS2甲基化增加1个SD与癌症风险增加20%以上相关,这取决于甲基化CpG位点的不同(图3)。
图3
图S4
图S5
线粒体相关基因甲基化和其表达之间的因果关系的分析
SMR分析得到了DNA甲基化CpG位点调控线粒体基因表达的基因列表,结果显示由rs6682266、rs5013329、rss56063031和rs6681857调控的NSUN4的甲基化与NSUN4的表达相关,而由rs2596495调控的VARS2甲基化也与VARS2的表达相关。
线粒体全基因组cis-pQTLs与癌症结局的MR分析
仅从cis-pQTLs中提取了23个线粒体相关SNP,在SMR分析后,没有发现因果关系。
对已识别的遗传变异进行全现象扫描
全现象扫描分析以排除所调查癌症可能的多效性[使用GWASATLAS和PhenoScanner数据库](图S8-S10)。根据以下选择标准:1)与结果共享相同的效应等位基因;2)关联达到GWAS显著性(P < 5 × 10−8;3)大小效应绝对值(β) >0.01。
与乳腺癌和前列腺癌有因果关系的NSUN4基因表达和DNA甲基化相关的变异与的次要性状无关,进一步表明NSUN4与这两种癌症的因果关系是强有力的(图S7和S8)。
rs6677385 (FDPS表达相关)与血尿素氮和克罗恩病等次要性状相关(图S9a)。
rs4750175 (NUDT5甲基化相关)也与内分泌相关的特征相关(图S9b)。
与VARS2甲基化相关的三个SNPs与代谢、骨骼、呼吸、精神、免疫和内分泌相关特征等多种特征相关(图S10)。
图S8
图S9
图S10
线粒体功能障碍与癌症的双向MR分析
对mtDNA拷贝数(线粒体功能障碍的代理生物标志物)和癌症进行双向MR分析的结果表明,因果关系方向是癌症类型特异性的;其中mtDNA拷贝数变异对宫颈癌、特定亚型卵巢癌有因果关系,而三阴性乳腺癌、头颈癌与mtDNA拷贝数变异有因果关系。
四、讨论
在本研究中,作者证明了以遗传易感性为特征的线粒体功能障碍对癌症具有因果影响,并确定了重要的推定因果线粒体相关基因:1)乳腺癌的FDPS;2)前列腺癌的NUDT5;3) VARS2治疗肺癌,4)NSUN4治疗乳腺癌和前列腺癌。
研究结果表明,线粒体功能障碍的遗传决定因素以癌症类型特异性的方式与癌症风险相关,这为将遗传位点、基因表达和甲基化与多种癌症联系起来的潜在机制提供了强有力的证据。
五、思维拓展
GWAS和MR分析,可以联合mQTL分析或者共定位分析找到一些与某基因甲基化水平显著相关的SNP位点。这样,以甲基化为中间桥梁,实现了SNP——甲基化——性状的生物学模型。利于探究对DNA序列变异和DNA甲基化之间关系,为和调控中的分子网络、基因变异与人类表型的潜在联系提供了新的见解。同时,研究还揭示了多个新的调控网络,这些发现为支持表型变异的生物学途径提供信息基础。
苦苦寻找新的研究切入点,不如将已有的研究热点“以旧翻新”!通过以上思路,可以在已有的临床研究的基础上,进行进一步的论证!应用范围十分广泛,大致可以分类为:
疾病易感性甲基化位点关联分析;
药物敏感性甲基化位点关联分析等。
对表型研究感兴趣的小伙伴不要错过,赶紧上车吧~