大家好呀,小编今天给大家带来的是2022年9月发表在nature communications(IF=17.694)上的一篇研究。作者通过研究RAS癌基因的活性,在肺腺癌中构建了RAS84 成功预测了患者的预后及化疗反应。提前剧透一下,大部分是我们熟知的TCGA等公共数据哦!快来一起看看,作者是如何通过分析公共数据将文章登录NC的吧!
一.研究背景
RAS癌基因在近20%的人类癌症中发生突变,并作为肿瘤形成和进展的驱动因素,KRAS是突变率最高的RAS亚型。大量的研究描述了突变KRAS在肿瘤侵袭性、转移和化疗耐药中的重要作用,但是关于KRAS突变对患者结局或化疗应答的预测价值在发表的研究中缺乏共识。在作者之前的研究中,作者通过人和小鼠肺腺癌模型证明了KRAS突变促进PD-L1表达,导致免疫逃逸。由于根据KRAS突变状态对患者进行的独特分层可能使在大型患者队列中进行的RAS突变研究变得复杂,于是作者提出了一种基于RAS调控的转录活性的分层方法,预测肺腺癌和其他实体癌的预后和治疗反应。在这篇研究中,作者获得了一个基因signature定义为RAS84,并构建了一个分类器,通过肿瘤患者中RAS84的表达对患者进行分层。通过这种方法,作者发现RAS转录活性可以预测肺腺癌和其他几种实体癌的临床结局。该方法提供了在大队列患者中研究致癌RAS活性的影响的可能性,并有助于预测与致癌RAS活性相关的治疗敏感性。
二.主要结果
由于KRAS可以改变并影响RAS通路活性,为了克服这一问题,作者首先从已发表的数据以及作者针对KRAS和sh-KRAS数据重组的HCT116细胞系中确定RAS靶基因。主要关注的是RAS信号激活背景下上调的基因,因为大多数signature只有上调的基因;为了减少肿瘤浸润免疫细胞的混杂信号的可能性,作者删除了两个免疫signature中的所有基因;最终确定的所有基因都由RAS的靶基因组成,与其他研究的signature几乎没有重叠。
1.利用肺细胞系表达数据构建RAS84
作者最初的目标是测量肿瘤细胞中的RAS通路活性。因此,作者将已建立的signature映射到CCLE的肺癌细胞系数据上,用来确定在不含基质细胞和免疫细胞的样本中那些signature准确的测定了致癌RAS的活性,以及已知KRAS突变是主要癌症驱动因素。作者首先通过去除细胞系中低表达的基因来清理特征,并删除了除KRAS外具有致癌RAS通路突变的细胞系,将过滤后的CCLE肺癌细胞系特征表达矩阵聚类为三组。根据组内signature基因的平均表达量将cluster命名为高RAS和低RAS,并将平均表达量中等的样本组归类为“未分类”。
利用KRAS突变在高RAS和低RAS基因簇中的分布来评估signature捕获RAS致癌活性的能力,作者发现“RAS通路”、“KRASG13D134”和“HRAS”是在高RAS组中富集KRAS突变的最佳signature(图1a)。接下来作者对这些组进行了差异基因分析,以确定在RAS高表达组细胞中上调的signature基因,进一步改进上述三个signature。从这些基因中,构建了RAS84 signature,并在CCLE的肺癌数据集上进行了测试(图1b)。
RAS84成功将42株KRAS突变株中的36株纳入RAS高表达组,6株未分类,0株为RAS低表达组。当与其他RAS和致癌signature比较时,RAS84给出了统计上最可靠的KRAS突变细胞系与RAS-low组的分离(图1d)。
2.RAS84表达可以在体外预测药物敏感性和耐药
为了确定RAS84的表达是否与抗癌药物反应相关,作者在RAS高和低的CCLE细胞系分组下分析了来自GDSC和CTRP数据库的药物敏感性数据,确定了两组之间有差异应答的药物(图2a),并对不同反应的药物进行了药物靶标terms富集(图2b)。作者发现RAS高的细胞系对靶向ERK MAPK和EGFR信号通路的药物敏感,也对蛋白稳定性和降解的药物敏感;DNA复制和有丝分裂是常见的化疗靶点,表明RAS84活性在体外与化疗耐药相关。作者还检测了KRAS突变(图2c)和RAS通路突变依赖的药物应答(图2d),结果发现两个突变组只对三种靶向ERK MAPK信号传导的药物敏感且未观察到对任何药物的耐药性。这一结果表明,RAS84比单独的KRAS突变或更广泛的RAS通路突变更好地捕捉了RAS驱动的药物反应。
3.肺腺癌中RAS84表达与KRAS突变相关
为了在细胞系之外进一步验证RAS84,作者将其应用于TCGA的LUAD数据上。鉴于与细胞系数据相比,在患者肿瘤样本中观察到的signature表达的异质性增加,作者探索了不同于细胞系数据三分类的患者聚类,将TCGA数据的样本聚类分成了五组(RAG0-4)(图3a),发现RAS84表达最低的一组中KRAS突变计数较低,其他的聚类都有高水平的KRAS突变,在25%到45%之间(图3b)。作者使用上述各种特征对患者进行了重新分组,发现RAS84对KRAS突变肿瘤分类最佳(图3c)。
作者将每个患者RAS84基因的平均表达量定义为RAS84-Index(RI)值。为了进一步确定这些组的特征,作者研究了在5个cluster中是否有其他报告的基因组改变表现出非随机分布。确定了在一个或多个RAS activity groups (RAGs)中富集的8个突变(图3d),并使用这些与聚类相关的突变来表征五种RAGs。作者在一个包含87例肺腺癌患者的独立队列中验证了KRAS,EGFR和TP53在RAGs中的突变模式(图3e)。
为了确定RAS84的表达是否反映了RAS-MAPK信号的活性,作者使用癌症蛋白质组图谱(TCPA)反相蛋白阵列(RPPA)数据32对349例TCGA LUAD患者进行了研究,发现与RAG-0相比,所有RAGs中一个或两个蛋白的磷酸化增加(图3f)。作者还确定了那些RAS84基因驱动了RAGs,通过与聚类中变异最大的基因进行相关性分析,发现7个小的基因cluster可以区分5个RAGs(图3g)。综上,作者证明RAS84在将KRAS突变型肺腺癌分类为具有RAS驱动转录活性的肿瘤方面表现最佳。
4.RAS84的表达大多是克隆性的
接下来的研究,作者主要探讨RAS84的预后价值。理想情况下,可靠的生物标志物不应受到采样区域的影响,因此不应受到大多数癌症中观察到的肿瘤内异质性的干扰。于是为了评估肺腺癌中RAS活性的肿瘤内异质性,作者将来自多区域TRACERx队列的样本分为5个RAS活性组(来自41例患者的102个样本);通过TCGA LUAD分类结果训练支持向量机(SVM)分类器,并使用该分类器为TRACERx样本分配RAG标签(图4a)。作者观察到与肿瘤间距离分布相比,RAS84在这些跨组肿瘤中的肿瘤内差距仍然很小(图4b)。
接下来作者通过与TRACERx肺腺癌队列中先前注释的表达异质性的基因集进行比较,评估了RAS84基因在肿瘤内和肿瘤间的表达差异。先前的研究将所有表达的基因根据它们在肿瘤内和肿瘤间的表达差异分为四组。作者发现RAS84基因在低肿瘤内、高肿瘤间表达差异组中显著富集3.2倍(图4c)。这表明RAS84富集了抗样本偏倚的基因。总之,这些数据表明RAS转录活性主要由肺腺癌肿瘤中克隆表达的基因组成,可能反映了RAS通路的致癌驱动能力;并且面对抽样偏差,RAS84特征可能是相对稳健的。
5.RAS84预测肺腺癌患者的生存和化疗反应
在许多临床前模型中,突变的KRAS癌基因促进肿瘤进展和转移,但在临床数据集中,KRAS突变状态与预后并不可靠的相关(图5a)。为了确定RAS84在肺腺癌中是否具有预后价值,作者进行了单变量Cox比例风险分析,比较了TCGA LUAD RAGs的总生存期和无进展生存期。作者发现我们发现与RAG-0相比,RAG-4在总生存期和无进展生存期均与阴性结果显著相关(图5b、c)。
作者还对RAS84 RAS指数(RI)值进行了单因素Cox比例风险回归模型分析。作者发现与预后显著正相关,表明RAS84表达增加是总生存率较差的预测因素。为了可视化RI预测结果的能力,作者使用该模型在RI值增加或减少两倍的情况下预测生存时间(图5d),研究表明RAG是预后的重要预测因子,特别是RAG-4、RAG-3和RI与不良预后显著相关(图5e-h);在校正其他预后预测因子的多变量分析中,结果表明只有RAS84显著预测了预后(图5i)。这表明RAS84在早期肺腺癌中具有超越已知临床预测因子的预后特性,并提示RAS通路活性可以促进人类肺腺癌的肿瘤进展。
由于在体外观察到一种化疗耐药表型,作者使用腺癌患者的TEMPUS队列进行了PFS多变量Cox比例风险分析,作者选择了接受过一线化疗的患者,并利用患者记录构建了PFS间期。结果表明RAG是化疗后PFS的重要预测因子,与RAG-2相比,RAG-3和RAG-4患者的反应较差(图5j)。最后,作者将RAS84与已发表的RAS特征进行比较,以预测对化疗的反应,结果未能显示RAS活性与治疗耐药的相关性(图5k)。综上,作者在来自两个独立队列的500多名肺腺癌患者中证明了RAG分类和RI量化的预后价值,还将RAG分类作为治疗应答的预测因子,从而证明了RAS84作为临床危险因素和应答生物标志物的价值。
6.RAS84可预测不同癌症类型的RAS-MAPK通路活性
RAS活性在肿瘤发生和癌症进展中的重要程度因不同组织而异,已知一些癌症主要是由RAS突变驱动,如胰腺癌、结直肠癌和肺癌。为了研究RAS84确定的RAS活性在不同癌症类型之间的差异,作者在泛癌分析中量化了RAS84对所有32种TCGA实体癌的作用为了比较不同癌症的样本,作者计算了每个样本的RI值(图6a),通过从每种癌症的平均RI值分布中确定了两种不同的癌症人群(图6b)。结果表明,在RAS高活性组中前五种RAS突变癌症中有四种是RAS驱动的(RAS基因突变率: 胰腺癌(PAAD) 71%,结肠腺癌(COAD) 50%,直肠腺癌(READ) 49%,肺腺癌(LUAD) 31%)。
接下来作者将RAS通路改变状态定义为至少一种RAS通路基因改变导致通路激活的患者数量。通过相关性分析发现(图6c),胃癌(STAD),膀胱癌(BLCA),头颈部鳞状细胞癌(HNSC),食管癌(ESCA)和肺鳞状细胞癌(LUSC)的RAS通路改变率均超过50%,表明是RAS通路的改变而不是RAS在这些癌症中驱动活性。图6d显示,在SKCM中RAS突变与RI不相关,而在THCA中呈现显著的负相关(图6d),这表明突变的RAS并不是这些癌症中RAS通路活性的主要驱动因素;作者还发现BRAF突变与高RI值显著相关(图6e),这表明BRAF是这两种癌症中致癌RAS通路活性的关键驱动因素。作者确定RAS84表达除LUAD外与CESC和PAAD的预后相关(图6f、g)。这一结果表明,RAS84定义的RAS活性在其他RAS驱动的癌症(如胰腺癌(PAAD))和RAS通路活性的癌症(如宫颈癌(CESC))中可能是一个预后指标。
至此,这篇文章就介绍完啦,内容较多,我们来总结一下:第一步作者先在先前的研究基础上确定了RAS的靶基因,并在肺癌细胞系的表达数据中构建了RAS84;第二步,作者通过分析公共数据库的药物敏感性数据,确定了RAS84与药物敏感型以及耐药相关。第三步,作者在非体外的细胞系的TCGA等患者组织数据上进一步验证RAS84效能,证明了其可以预测患者预后及化疗反应的作用;最后,将其扩展到泛癌水平进行多个癌症中的讨论。整体思路是我们熟悉的biomarker的研究思路,单个癌症的证明+泛癌水平的讨论,而且数据大部分也都是我们耳熟能详的TCGA等公共数据。然而,这篇文章在2022年依然可以登上NC,小编认为,这篇文章最大的亮点还是在于作者的书写表达,作者对于每一个结果的阐述非常完整,做到每个结果有理有据有总结,结果间的逻辑承接丝滑流畅,是一篇难得的好文章,推荐大家下载原文进行阅读学习哦!