如何从患者的临床数据入手进行生信分析?今天小编和大家分享的一篇今年11月刚刚发表在Nat Commun(IF:17.694)杂志上的文章就给出了答案。由于青少年和青年中癌症具有很高的发病率及死亡率,但其生物学基础尚不完全清楚,因此这篇文章就从患者年龄数据入手,进行了一系列基因及临床分组分析。文章条理清晰,内容丰富,而且这种从患者临床表型入手的生信分析思路也十分值得我们参考学习,长话短说,现在就让小编带大家一睹为快吧。
Genomic disparities between cancers in adolescent and young adults and in older adults
癌症在青少年、青年和老年人中的基因组差异
一.文章背景
如今研究发现在美国每年青少年和青年人(adolescents and young adults,AYA;15-39岁)中约有89000人受到癌症影响,而老年人( older adults,OA;>39岁)的发病率约为5%,比儿童(0-14岁)高8倍。此外,在过去的30年里,AYA患者的生存率几乎没有任何改善,而儿童和老年人的生存却有了显著的提高。而且由于缺乏专门的AYA癌症项目,许多研究将AYA患者与年幼的儿童或老年人分组,加之AYA患者参加临床试验的人数也较少,因此人们对AYA相关的基因组改变仍知之甚少。所以这篇文章就对癌症的AYA和OA组进行了系统性地比较。
二.文章摘要
文章分析了来自GENIE数据库的临床数据及基因组数据,对超过10万例AYA和OA癌症患者进行了分析,并比较了AYA和OA组之间的临床和基因组差异。结果研究发现AYA和OA组癌症患者在临床表现上有显著差异。此外,研究也发现在大多数癌症类型中,AYA组表现出较低的突变负荷和较少的基因组不稳定性,这也导致大多数癌症基因在AYA组中表现出较少的突变和拷贝数变化。然而,研究也发现CTNNB1和BRAF突变的比例在AYA组的多种癌症类型中过高,且AYA组也表现出更多的驱动基因融合。研究也进一步发现组织学亚型是导致AYA和OA之间遗传差异的一个重要因素。最后研究通过突变特征分析也发现AYA中内源性突变过程较强,外源性突变过程较弱。
三.研究的主要内容及结果
1. AYA 和 OA 癌症的临床差异
在文章的第一部分,作者首先对AYA和OA组癌症患者的临床差异进行了介绍。研究纳入了GENIE队列的19种癌症类型,分别为甲状腺癌、肾细胞癌、黑素瘤、头颈癌、食管胃癌、结肠直肠癌、白血病、肝胆的癌症、胰腺癌、骨癌、乳腺癌、生殖细胞瘤、原发不明的癌症、软组织肉瘤、中枢神经系统癌症、神经胶质瘤、非小细胞肺癌、卵巢癌及子宫颈癌,并基于年龄分为AYA和OA组。研究发现除了乳腺癌、卵巢癌和宫颈癌(CESC)等与性别相关的癌症类型外,AYA组中的甲状腺癌(THCA)、肾细胞癌、黑色素瘤、头颈癌、食道胃癌和结肠直肠癌的女性比例更高 (图1a),这表明性别与AYA患癌密切相关。进一步作者也发现有八种癌症类型在两组间存在转移比例差异(图1b)。研究也观察到,在AYA组中有9种癌症表现出非西班牙裔亚裔患者显著增加(图1c),另有13种癌症表现出非西班牙裔白人比例降低。接下来,作者比较了两组的组织学亚型,将GENIE数据集中的19种癌症进一步划分为371个亚型,结果发现了105种亚型在两组间存在不同分布,表明AYA和OA在癌症组织学上存在广泛的差异。
2. AYA 和 OA组间的基因组差异
在这一部分文章对AYA和OA组癌症之间的遗传差异进行了刻画。研究比较了两组患者的总体肿瘤突变负荷(TMB),共涉及16种癌症,结果发现AYA组的中位TMB比OA组低。此外,作者也观察到两组间有13种癌症的TMB存在显著差异。接下来作者使用Fisher’s检验和logistic模型两种方法识别出88个显著的基因-癌症对(gene-cancer),其中41对是两种方法都识别到的。作者发现logistic模型确定的基因-癌症对中,有25对的突变仅与AYA有关,其余的突变则除了AYA外,还与一个或多个其他因素有关。对于仅通过Fisher精确检验确定的38个基因-癌症对,作者发现有24对与组织学、性别和转移状态有关(图2a,b),这些结果表明,组织学亚型在癌症遗传差异中起着重要作用。
3. AYA与OA组间基因表现出不同的突变率
接下来作者又对AYA及OA两组间癌症的基因突变频率进行了分析。这一部分作者重点研究了上述88对基因癌症对,将在两种或两种以上癌症类型中发现的显著基因分为复发基因,反之为非复发基因(图2 d)。作者发现大多数复发基因在AYA中表现出较低的突变率(图2c),这与AYA整体较低的TMBs一致。接着作者也观察到非复发基因在AYA中显示出较低的突变率(图2d)。研究也发现表观遗传修饰相关基因往往在AYA中表现出更多的突变。此外,由于作者在一些儿童癌症中观察到BRAF和H3F3A等基因的频繁突变,因此作者研究了AYA中这些基因突变率的增加是否是它们在儿童癌症中频繁突变的延伸。作者以胶质瘤为例对5个频繁突变的胶质瘤基因进行了研究,结果作者发现从儿童到AYA再到OA,BRAF和H3F3A的突变率随着患者年龄的增加不断下降,然而,TP53、ATRX和IDH1却与此相反,三者在AYA中突变率最高。这些结果表明,从遗传学上讲,AYA组不仅仅是儿童肿瘤的延伸。接下来作者使用TCGA数据集来对这些结果进行验证,结果TCGA数据再现了这些差异,支持了研究结果具有鲁棒性。
4. AYA中存在TERT启动子突变
由于端粒酶对维持癌细胞的永生至关重要,因此在这一部分作者对编码端粒酶相关亚基的TERT进行了分析。由于AYA患者较年轻,因此AYA中的癌症更有可能起源于端粒酶活性细胞,因此可能携带较少的TERT启动子(TERTp)突变。为了验证这一假设,作者比较了15种癌症类型中的TERTp突变。结果发现黑色素瘤的TERTp突变率最高,其次是头颈癌、胶质瘤(图2f)。接着作者对AYA及OA进行比较,发现在测试的15种癌症类型中,有5种表现出显著差异,包括胶质瘤、THCA、肾细胞癌、头颈癌和卵巢癌。作者也发现AYA胶质瘤有更多ATRX突变, ATRX是一种染色质调控子,与端粒替代延长(ALT)有关。此外,作者构建了一个逻辑回归模型,考虑了AYA状态、性别、组织亚型和转移状态等因素,结果发现AYA与TERTp突变显著相关。
5. AYA中的基因拷贝数分析
在这一部分作者对AYA中的基因拷贝数进行了分析。作者计算了基因组不稳定性(GI)分数来研究受拷贝数变化影响的基因组的比例。结果发现在检查的16种癌症中,AYA和OA之间的GI评分有显著差异(图3a)。除BRCA外,其余均显示AYA评分较低。为了了解AYA中BRCA的GI较高的原因,比较了AYA和OA之间的基因水平拷贝数变化,并在9种癌症类型中识别了46对显著的基因-癌症对,其中包括32个扩增和14个缺失(图3b)。研究发现大多数基因-癌症对在胶质瘤、BRCA和软组织肉瘤的AYA中扩增更频繁,而OA中缺失更频繁。作者观察到在AYA BRCA中识别出超过半数在AYA中过度表达的扩增基因(12/21),这些基因位于两个扩增子中,一个包含ERBB2和CDK12,另一个包含其余基因。第一个扩增子与TP53突变同时发生,而第二个扩增子与GATA3突变同时发生(图3c)。
6. AYA与OA的基因融合比较
在这一部分对AYA与OA中的基因融合进行了比较。作者首先检查了复发融合的差异,结果发现了6对不同的融合-癌症对(图3d),其中5种在AYA中更为常见,包括软组织肉瘤,非小细胞肺癌,THCA,以及胆管癌。接着为了评估这些融合的转录影响,作者使用TCGA数据比较了融合阳性和融合阴性肿瘤中参与融合的癌基因的表达水平。结果显示,癌基因在融合阳性肿瘤中高度表达。接着作者将分析扩展到融合伴侣基因,并将分析限制在每个癌症队列中最低发生率为2%的基因,结果发现了16对癌症-基因对(图3e),其中8对来自上述复发融合,且在这8对有4对更频繁地出现在AYA中。
7. AYA中的超突变样本与免疫应答的关联
在这一部分作者对AYA患者与ICB获益的关联进行了研究。作者使用MSK免疫治疗队列比较了接受免疫检查点抑制剂(ICI)的患者的总生存率,结果发现在泛癌中AYA的总生存率较低(图4a)。此外,多因素分析在控制了癌症类型、转移状态和性别后也对上述结果进行了证实(图4b)。作者推测AYA对ICIs反应较差的部分原因可能是其肿瘤突变负荷(TMB)较低。研究认为TMB越高的AYA患者反应越好,因此接下来作者计算了突变密度(即每Mb编码非同义突变的数量)来识别了超突变体。结果作者在AYA中识别出了340个超突变体,在OA中识别出了5632个超突变体。接着为了研究AYA中超突变体机制,研究使用deconstructSigs将它们的突变分配给Catalogue of Somatic Mutations in Cancer (COSMIC),结果发现研究识别了一个显性特征(图4c)。接着作者发现遗传缺陷导致的特征在AYA中比在OA中更常见(图4d)。相比之下,与环境因素相关的特征在OA中更为频繁。进一步,研究也发现一些特征在AYA中表现出癌症偏性(图4c)。研究也发现AYA的DNA错配修复缺陷(MMR)胶质瘤的缺失单核苷酸变异(SNV)低于其他MMR肿瘤,但仍高于具有替莫唑胺(TMZ)暴露特征的胶质瘤(图4e)。
8. AYA的临床治疗
在文章的最后一部分,作者对AYA的临床治疗进行了介绍。作者根据OncoKB(一个人工注释的可操作的靶向药物数据库)对每个突变进行注释(图5)。结果发现在AYA中,11.8%的肿瘤中存在1级或2级改变,2.3% 的肿瘤存在3A级改变,23.5%的肿瘤存在3B级改变。根据OncoKB的定义,1级改变是指那些可以被FDA批准的药物靶向的改变;2级是可以预测对FDA批准的药物反应的标准护理生物标志物;3A级是研究药物可能靶向的改变,3B级是针对不同癌症类型的已批准或研究药物的改变。
到这里这篇文章的主要内容就介绍完了,文章以患者年龄为切入点,对癌症患者进行分层,进一步研究了不同年龄组的基因组及临床特征。文章的内容丰富,逻辑严谨,有理有据,研究泛癌的小伙伴不要错过呀。