代谢组与基因组的碰撞——不懂生信也可以复制的MR分析思路
代谢产物在表型调节中发挥重要作用,但代谢产物与肿瘤之间的因果关系尚未得到充分研究,作者通过孟德尔随机化(MR)研究来研究代谢产物与各种癌症之间的因果关系。整合了代谢组学和基因组学,以探索癌症发生的危险因素。在临床实践中,是否可以将具有因果关系的代谢物作为生物标志物来区分癌症高风险患者,这一点值得探讨。需要更详细的研究来阐明机制途径。
今天再分享一篇在前人研究的基础上,推陈出新的文章“(遗传决定的代谢产物对肺癌、乳腺癌、卵巢癌和胶质瘤等癌症的因果影响:一项孟德尔随机化研究Causal effects of genetically determined metabolites on cancers included lung, breast, ovarian cancer, and glioma: a Mendelian randomization study )”,于2022/7/11发表在Transl Lung Cancer Res上~
这一类的文章,均为思路简洁,可复制性强,新手小白也可以学!只要紧追热点,跟紧数据库中的更新数据,打开思路,联系临床即可!同时,作者和的研究结果也可以作为我们研究其他癌症研究的基础,可以结合转化和临床研究来解释代谢产物如何诱导癌症的发展以及它们在相关疾病发病机制中的作用。
下面是原文,学习起来吧~
一、背景
代谢产物是影响肿瘤发生的关键因素之一。例如,肝激酶B1(LKB1)突变型肺癌具有核苷酸代谢缺陷,导致对脱氧胸苷酸激酶抑制的超敏反应。N-乙酰天门冬氨酸在促进肿瘤生长中起着重要作用。2-羟基戊二酸在胶质瘤中异常升高。然而,关于代谢产物与肿瘤之间的因果关系的研究并不全面。
由于代谢组学的敏感性,可以检测到生物行为的细微变化,从而深入了解各种生理状态和异常过程以及合并疾病的机制。但生物标志物验证的最大挑战之一是克服由于遗传因素和环境暴露的差异导致的个体间代谢物差异。鉴定代谢产物及其生物学作用是至关重要的一步。在这些条件下,许多研究表明代谢组学在癌症研究中具有巨大潜力。
孟德尔随机化(MR)是一种基于GWAS汇总数据的通用方法,以遗传变异作为工具变量(IV)评估暴露与结果之间的因果关系。换句话说,GWAS的基因变异可用于模拟随机对照比较,以验证各种因素之间的因果关系。此外,GWAS已扩展到代谢概况。
作者使用双样本MR方法来检测基因决定的代谢型(GDMs)对肺癌(LC)、乳腺癌(BC)、卵巢癌(OC)和胶质瘤的因果效应影响。
二、方法
1.代谢产物GWAS的遗传变异
经过严格的质量控制,486种代谢产物被用于遗传分析,其中309种已知代谢产物和177种未知代谢产物。309种已知代谢产物被进一步分为8个广泛的代谢类别(氨基酸、碳水化合物、辅因子和维生素、能量、脂质、核苷酸、肽和异种代谢)。流程图如图1。
图1流程图
2.工具变量的选择标准
一开始,从486种血清代谢物中选择SNP采用统一标准。我们选择了汇总统计中列出的SNPs,这些SNPs通过了质量控制,P<1×10-5,该松弛统计阈值通常在MR研究中实施,以说明当少数全基因组显著SNPs可用于暴露时的更大变化。
聚类程序通过连锁不平衡(LD)分析完成,以较低的P值作为独立的工具。此外,接下来的步骤是评估这些工具变量是否足够强大,以通过两个参数预测因果效应:解释的遗传变异(R2)和F统计。根据公式F=R2(n−k−1)/(1−R2)k(n是样本量,k代表SNPs的数量),计算与相应代谢产物暴露相关的前者和F统计,以避免仪器偏倚(表S1)。
广泛地说,F统计量大于10被作为选择强工具变量的典型阈值。将筛选出每种小于10的代谢物的F统计。
癌症GWAS的遗传变异
为了评估代谢产物与四种癌症之间的潜在因果关系,纳入了来自不同联合体的四种癌症GWAS汇总统计数据。根据癌症类型对不同人群的整合源自以下联合体:国际肺癌协会联合会(ILCCO),肺癌[包括11348例病例和15861例对照,组织学上可分为肺腺癌(LAC)和鳞状细胞癌],乳腺癌协会联合会(BCAC),针对乳腺癌(包括122977例病例和105974例对照,分为ER阳性乳腺癌和ER阴性乳腺癌),卵巢癌协会联合(OCAC)针对卵巢癌(包括25509例病例和40941例对照)。关于胶质瘤的GWAS包括14个队列、3个病例对照研究和1个基于人群的病例研究(包括6811例病例)(表S2)。
表S2
3.MR统计分析
MR的原理如图S1所示。使用逆方差加权(IVW)方法估计代谢物与四种原发性癌症之间的因果关系。然后,我们使用Bonferroni校正,使用P<1.02×10−4(0.05/486)的多重测试调整阈值。敏感性分析:采用加权中值、MR Egger和留一法进行敏感性分析,并检验第二种假设。通过MR Egger回归和MR-PRESSO全局检验检测到水平多效性的存在。最后,利用可用数据进一步探讨了亚组分析。
图S1 MR分析流程
4.代谢途径分析
使用基于web的MetaboAnalyst 5.0软件对识别的代谢产物进行代谢途径分析。所有代谢产物在PIFW<0.05时通过IVW鉴定。当使用途径分析模块来探测可能参与四种主要癌症生物学过程的潜在途径时,共有49条来自两个代谢产物集合库的人血清代谢途径,包括来自小分子途径数据库(SMPDB)和KEGG数据库的44个代谢产物集,仅来自KEGG库的4个代谢产物。
三、结果
1.研究概况
使用GWAS汇总统计数据进行了两样本MR分析,以评估人类血清代谢物对四种原发性癌症的因果影响。流程图如图1。工具变量在其各自表型中的解释率为0.01%至9.37%。遗传预测因子有效性检验的最小F统计量为17.21,这说明486个代谢型的所有工具变量都足够可信(F统计量>10)。
2.代谢产物对癌症的因果效应
通过使用遗传变异作为代理变量,鉴定出202个显著的致病关系特征。7-α-羟基-3-氧代-4-胆甾醇酸酯、γ-谷氨酰异亮氨酸、1-油酰基甘油磷酸胆碱、γ-Gutamylyleucine是肺癌卵巢癌、乳腺癌和胶质瘤危险因素;假尿苷、2-甲基丁酰基肉碱、2-甲酰丁酰基肉碱、甘氨酰缬氨酸是对肺癌、卵巢癌、乳腺癌的保护因素,和胶质瘤(表1)。
表1
不同类型癌症的已知和未知代谢产物之间的所有重要致病关系特征如图2所示。结果显示,2-甲基丁酰肉碱降低了肺癌、乳腺癌和卵巢癌的发病率,但与胶质瘤的较高死亡率相关(表2)。
表2
图S2
3.敏感性和多效性分析
为了避免MR研究的水平多效性,进行了敏感性和多效性分析(表3)。
甲基丁酰基肉碱对乳腺癌和肺癌具有多效性(图3)。通过所有敏感分析(P<0.05)的四个提示性关联特征:亮氨酸对肺癌的影响、3-脱氢肉碱对乳腺癌的影响、布洛芬对卵巢癌的影响,亮氨酸对卵巢癌的影响。
表3敏感性和多效性分析
图3
图2 不同类型癌症的代谢产物之间的致病关系
表2
4.肺癌和乳腺癌的亚组分析
在ILCCO和BCAC获得的暴露中,肺癌分为腺癌和鳞状细胞癌;乳腺癌分为ER阳性癌和ER阴性癌。在Bonferroni校正下,2-甲基丁酰肉碱对LAC(ORIVW=0.60;95%可信区间:0.48–0.70;PIFW=1.14×,但在ER阴性乳腺癌(ORIVW=1.06;95%CI:0.88–1.26;PIFW=0.55)和鳞状细胞肺癌(SCLC)(ORIVW=0.78;95%CI=0.63–0.98;PIFW=0.03)中,这些结果可能为不同肿瘤的生物发生机制提供潜在证据。值得注意的是,当进行两次额外的MR测试时,2-甲基丁酰基肉碱和LAC之间的因果关系是可靠的(加权中值=0.007,PMR Egger=0.019)。表S20和S21中列出了解释2-甲基丁酰肉碱与两种癌症之间关系的这些遗传变异。敏感性分析结果一致,见表S22-S24。
5.代谢途径分析
代谢途径分析确定了四种癌症中的四种代谢途径(P<0.05)。结果表明,“维生素B6代谢(P=0.028)和丁酸代谢(P=0.047)”通路可能参与肺癌的发生。“氨酰tRNA生物合成(P=0.006)和苯丙氨酸、酪氨酸和色氨酸生物合成(P=0.033)”途径可能与LAC相关(表S25)。
四、讨论和小结
这项MR研究使用标准IVW和替代加权中值MR Egger方法提供了人类血清代谢物对四种原发性癌症的潜在因果影响。使用遗传变异作为工具变量,观察到137种与癌症风险相关的代谢产物。
这篇文章可以学习的优势之处在于,这项研究是第一项将代谢组学与基因组学相结合的MR研究,以检测血清代谢产物与癌症的因果关系。其次,作者所选择代谢产物与癌症之间因果关系的方法是值得借鉴的!全文清晰且严谨,用了包括IVW、加权中值和MR Egger在内的多种方法,并且,实施了严格的Bonferroni校正。
总之,这一项MR研究确定了132种可能对癌症进展有因果影响的代谢物。有趣的是,38种代谢产物对不止一种癌症有因果影响,这意味着不同癌症之间存在一些重叠的代谢途径。作者和的研究结果也可以作为其他癌症研究的基础,并结合转化和临床研究来解释代谢产物如何诱导癌症的发展以及它们在相关疾病发病机制中的作用。
思路扩展
小编认为泛癌是孟德尔分析较为高阶的应用,但是思路简单,不需要设计过于复杂的研究方案,完全可以用临床医生的思路来寻找问题!解决方案也类似于前瞻性队列研究的思维方式,简直不要太方便!
近期,涌现了非常多的癌症相关的孟德尔分析的高分文章,范围广泛,创新点多,但大多没有特别深入!新手小白只需要抓住某一具体的研究热点,使用已经整理好的数据,做进一步的探究,即可轻松搞定一篇质量中上等的文章!常用的暴露因素和泛癌结局指标已经在上一篇文章中做好了总结!
热点写一篇,就少一篇!趁着新鲜,抓紧时间,趁着现在快速上车吧~