无创的生物标志物一直都是研究人员努力探寻的目标。与其他生物标本相比,尿液的采集是无创的,而且易于大量获取,可以在大规模人群中进行采集。尿液中的蛋白质与我们的健康状况密不可分,在尿蛋白中筛选癌症相关的标志物,为癌症的早期筛查探寻新的marker。今天小编就带大家阅读一篇2022年11月7日发表在EBioMedicine(IF:11.205)上的一篇蛋白质组学相关的文章。
Urine proteomic signatures predicting the progression from premalignancy to malignant gastric cancer
从胃早期病变到恶性胃癌的尿蛋白组学特征
文章概括
胃癌 (GC) 的早期筛查仍具有挑战性。本研究目的是探究尿蛋白质组学特征并鉴定可以预测胃的病变进展和GC风险蛋白质。研究对象包括不同阶段的胃癌和胃部病变的患者。受试者年龄在40-69岁之间,并且之前没有诊断出肾脏或泌尿系统疾病。本研究共招募了255名受试者,其中123名来自中国临朐的训练集,132名来自临朐和北京的验证集。进一步针对60名患有胃部病变的受试者进行了297-857天的随访。在GC与轻度或晚期胃病变受试者中鉴定了43种差异表达的尿蛋白。尿液中ANXA11、CDC42、NAPA 和 SLC25A4的基线水平与胃病变进展的风险进一步正相关。除了SLC25A4其他三个在GC中的表达也高于非GC样本。研究整合了四种蛋白质在预测胃病变进展和GC风险。
总结:这项研究揭示了独特的尿液蛋白质组学特征和一组可预测胃病变进展和GC风险的尿蛋白。这些非侵入性方法中的生物标志物可能对胃癌的早期检测具有转化意义(图1)。
主要结果
GC与胃病变之间差异表达的尿蛋白(DEPs)
采用偏最小二乘判别分析(PLSDA)对轻度胃病变(SG/CAG) 、进展期胃病变(IM/LGIN) 和GC患者的尿蛋白组进行分析。在患有GC和胃损伤的受试者之间观察到不同的尿蛋白谱(图 2a)。在GC和胃病变(SG/CAG 或 IM/LGIN)比较分析中,鉴定了139种变量重要性(VIP)得分 >1的蛋白质,但没有鉴定出用于比较轻度和晚期胃病变的蛋白质。为了探索不同胃病变和GC之间尿蛋白水平的变化轨迹,通过无监督的层次聚类定义了这139个尿蛋白中的6个簇,它们显示出从癌前病变到GC的动态变化(图 2b)。139种蛋白质的显着富集通路及其聚集簇如图2c所示。前2个富集通路分别聚集在 Cluster-2(碳代谢通路)和 Cluster-1(淀粉和蔗糖代谢通路)中。Cluster-2具有最大的蛋白组装体,其蛋白表达在轻度和晚期胃部病变中没有明显变化,但在GC中大幅飙升。相反,Cluster-1蛋白在GC中的表达下降。
使用logistic回归模型计算了139种VIP > 1的蛋白质与GC风险之间关联的OR。 其中,82 种蛋白质在训练集与GC风险显着相关(P < 0.05),其中43种蛋白质在验证集中同样被定义为GC风险的DEP(图 2d)。接下来作者可视化了这 43个 DEP的蛋白质簇和网络。计算43中DEP之间的Pearson相关性,发现许多DEP呈正相关(图2e)。在蛋白质-蛋白质相互作用(PPI)网络中筛选了前15个潜在的核心蛋白(图 2f)。
与胃病变进展和胃癌风险相关的关键蛋白
在跟踪随访的受试者(n = 60)中,进一步检查了上述确定的43个DEP是否与胃病变的进展有关。在随访期间,18名受试者的胃部病变进展到更严重的水平,其中2名发展为GC。在训练集和验证组中,GC中四种上调的尿蛋白进一步与胃病变进展风险增加显着相关(P < 0.05),包括ANXA11、CDC42、NAPA 和 SLC25A4(图3a和b)。所有四种蛋白质都聚集在cluster-2中,并富集在胞吞作用(CDC42)、cGMP-PKG信号通路(SLC25A4)和突触小泡循环(NAPA)(图2c)等功能。 SLC25A4在PPI网络分析中也显示为核心蛋白(图2f)。分层分析发现,在基线轻度 (SG/CAG) 或晚期胃病变组 (IM/LGIN) 的进展受试者中,这四种蛋白质的水平始终较高。
整合蛋白质生物标志物的蛋白质评分,构建预测模型
研究计算了整合四种关键尿蛋白的蛋白质评分。与CAG或LGIN相比,蛋白质评分与GC风险独立相关。并且,蛋白质评分与胃病变进展的风险显着相关(图3c)。与包括年龄、性别和基线病理学的模型相比,整合蛋白质评分显着提高了预测GC风险的能力(图3d-f)。
组织水平的DEP与GC和胃病进展的风险
利用组织的蛋白质组学数据集,发现在胃组织样本中也检测到了上述43个尿液 DEP中的34个蛋白质。然后比较了GC和非GC组织之间的表达。其中,21种组织蛋白的关联与尿液水平的关联方向相同,仅13种组织蛋白具有统计学意义(图 4)。对于与胃病变进展和GC风险相关的四种关键尿蛋白分析,发现GC中三种组织蛋白(ANXA11、CDC42 和 NAPA)的水平显着升高,与基于尿样的结果一致。
基于尿液蛋白质组学数据的免疫细胞分类和免疫亚型
使用NUWA方法(蛋白质组学反卷积分析),利用尿液蛋白质组学特征来估计每个受试者10种主要免疫细胞类型的相对比例。Spearman相关分析显示,两种关键蛋白质(CDC42、SLC25A4)的尿液水平和蛋白质评分与CD8+ T和NK细胞比例具有统计学显着相关性,但相关系数仅显示出弱相关(图5a)。基于每个受试者估计的免疫细胞比例,然后得出三个免疫簇(IC)。在三个免疫簇中,10个主要免疫细胞丰度都显着差异。IC1具有高比例的CD4+ T和树突状细胞,IC2具有丰富的嗜酸性粒细胞和中性粒细胞,IC3具有丰富的 CD8+ T、NK细胞和B细胞(图 5b)。此外,患有GC的受试者倾向于富含 IC3(图5c)。在GC患者中CD8+ T 和 NK 细胞上调(图5d)。上述细胞进一步细分为六个细胞亚群,分析发现CD8+ TEMRA、CD56dim 和 CD56bright NK 细胞在GC样本中上调(图 5e)。
结语
文章到这里就要结束了~阅读完的小伙伴是不是觉得受益匪浅呢!在这篇工作中,采用经典的生物信息学方法,找GC进展相关的尿蛋白,最后与免疫关联。逻辑严谨,是一篇非常值得借鉴的蛋白质组学的文章。
在纯生信文章越来越难发的现在,多组学测序、实验慢慢成为了文章不可或缺的一部分,毕竟作为科研探索的生信分析只是探路石,自己的数据和实验才是最有力证据。要想发高分文章,纯生信文章还是很难做到的,“干湿结合”才更容易,生信人也准备了蛋白组的生信思路,有数据的小伙伴不要错过了!