空间转录组测序技术(ST)能够将基因表达情况与感兴趣组织切片的染色图像进行整合,将组织内细胞的基因表达信息定位到原始空间位置上,从而直接观测组织中不同区域基因表达的差异。小编今天和大家分享一篇今年一月刚刚发表在CANCER RESEARCH(IF:13.312)杂志上关于三阴性乳腺癌空间转录组分析的文章。文章利用空间转录组数据识别出了三阴性乳腺癌的保守结构,并对其功能及预后影响进行了分析,文章逻辑清晰,简单易懂,对空间转录组感兴趣的小伙伴不要错过呀。
Spatial transcriptomic analysis of a diverse patient cohort reveals a conserved architecture in triple-negative breast cancer
不同患者队列的空间转录组分析揭示三阴性乳腺癌的保守结构
一、研究背景
乳腺癌是最普遍的女性癌症,分为不同的组织学和分子亚型。其中,三阴性乳腺癌(TNBC)是一种不表达雌激素受体、孕激素受体或HER2扩增的乳腺癌。由于TNBC具有更强的侵袭性,且易发生早期转移,因此在临床治疗上具有挑战性。此外,TNBC与其他乳腺癌亚型相比也表现出更高的复发率及更差的预后,而且由于TNBC缺少可操作靶点的表达,使得开发有效的治疗方法更加困难。因此,该文章利用空间转录组数据来研究TNBC,以期能够全面注释其空间结构并探索细胞亚群的转录状态。
二、文章摘要
研究对14例TNBC患者的28个切片队列中的38706个空间特征进行了空间转录组分析。研究发现肿瘤内各个切片的空间特征表现出不同的转录亚结构。研究进一步对所有样本进行综合分析识别了9个不同的转录亚群。此外,研究使用连接计数分析也发现了共享转录亚群的非随机定向空间依赖性,证明了TNBC中存在保守的空间转录结构,这些发现也在独立的验证队列中得到了证实。此外,研究也分析了这些转录亚群的功能及预后影响。
三、文章的主要内容及结果
1. 样本的选择及空间转录组
文章第一部分对使用的样本及空间转录组数据进行了介绍。研究选择了14例原发性TNBC肿瘤样本进行研究,并从每个肿瘤中获得两个组织切片。因此,研究队列包括28个TNBC组织切片,接着作者进行了空间转录组(ST)研究,研究流程如图1所示。最终,平均每个样本产生了1382个空间特征的表达数据,接着研究对每个样本的表达数据进行标准化,后续分析均使用标准化的数据进行。
2. 样本的人工及基因特征注释
这一部分文章对样本的注释进行了介绍。研究首先由解剖病理学家根据染色图像对每个样本的癌组织进行了手动标注(图2A),结果发现切片以肿瘤和纤维化区域为主,而坏死区域、脂肪组织和免疫浸润较少。接下来,研究使用ESTIMATE定义每个样本的转录结构,发现ESTIMATE结果与组织手工注释结果紧密相关,例如样本094D(图2A)中,ESTIMATE的间质评分展示了广泛的纤维化区域(图2B),而肿瘤纯度评分则准确地识别了肿瘤区域(图2B-C)。此外,在样本120D中,人工注释发现了的密集的淋巴浸润区域以及纤维化和坏死区域(图2D),而ESTIMATE评估同样观察到了一致的结果(图2E-F)。接下来研究使用了一组来自肿瘤相关免疫细胞的细胞类型特异性表达特征,对免疫细胞浸润特征进行进一步刻画,发现了T细胞富集的空间模式及其余区域巨噬细胞强烈表达的特征(图2G-H)。接着研究进一步观察到同一患者的样本显示出相似的肿瘤纯度(图2I),且UMAP降维也反映了配对样本的转录的相似性。此外,研究发现在所有样本中免疫评分和间质评分密切相关,两者在组织学定义的纤维化区域富集(图2J)。
3. 聚类揭示了瘤内异质性
这一部分研究对TNBC的遗传异质性进行了探索。作者首先在单个样本内使用ST数据进行无监督聚类,结果观察到低分辨率的空间特征聚类识别的肿瘤和间质区域与基于组织学和信息学注释的结果一致(图2A-B)。此外,研究也观察到肿瘤及间质存在不同的转录区域(图2A-B)。研究发现样本平均包含4个肿瘤亚群和1个非肿瘤亚群(图2C)。接着,研究基于表达数据对样本094D进行聚类分析,识别出6个亚群(图3A-B),其中3个亚群肿瘤纯度高,还有一个亚群表现出较低的肿瘤纯度,为纤维化的亚群(图3C-D)。研究也观察到样本中混合Lehmann等人定义的TNBC亚型(图3E)。接下来研究通过差异表达识别了每个亚群的表达特征(图3F-G),并通过基因集富集分析(GSEA)来识别每个亚群富集的分子通路(图3H),研究也观察到亚群水平的GSEA的结果与特征水平的富集结果一致(图3I)。
4. 数据整合及共享细胞亚群的识别
在这一部分作者研究了TNBC共享的空间转录特征。研究首先整合了所有特征的表达数据,接着进行聚类分析,得到9个整合亚群(ICs)(图4A),然后作者对亚群中可以映射回单个样本的特征进行了分配来评估跨样本及切片的聚类子结构(图4B)。结果发现亚群IC3、IC6和IC7可能代表间质免疫细胞,而其余亚群则主要是肿瘤细胞并具有不同的肿瘤纯度(图4C)。此外,研究也发现每个IC都以不同的比例出现在所有个体样本中(图4D)。研究进一步评估了IC的标记基因(图4E),发现标记基因与各自的IC共定位(图4F)。接下来,研究对IC表达数据进行GSEA分析,发现IC5中富集缺氧特征,而IC9参与干扰素α和γ反应通路(图4G)。接着作者对IC的表达数据进行CIBERSORTx分析,结果发现与ESTIMATE和GSEA分析一致,IC3的CIBERSORTx得分最高(图4H)。此外,肿瘤簇IC5具有较高比例的肿瘤相关巨噬细胞,而CD4及CD8 T细胞则相对缺乏(图4H)。
5. 整合亚群的空间分布
研究在这一部分对整合亚群的空间分布进行了分析。作者使用连接计数分析(JCA)对IC之间的空间相关性进行了研究(图5A)。接着研究对空间数据进行光栅化并保持分类信息(图5B-C),结果发现空间上接近的观测结果有许多相似的邻居和连接(图5D),而空间分散的观测结果则展现出邻居不相似性(图5E)。接着作者将观察到的每对观测数据的连接计数与空间随机条件下的预期结果进行了比较(图5F)。此外,研究使用z-score表示空间相关性,发现每个IC通常具有强的正自相关特征(图5G)。接下来作者将JCA应用于所有样本(图5H),结果观察到几个亚群的空间关系具有一致的模式(图5I)。
6. 独立验证队列的注释
在这一部分作者在验证队列中验证了参考队列定义的IC。验证队列中的样本从II期到III期且具有不同的肿瘤纯度(图6A)。接下来,作者将IC标签与每个样本的手动注释和肿瘤纯度评分进行了比较(图6B-D),且当对所有样本的肿瘤纯度评分进行分析时发现其模式与参考队列中的模式相匹配(图6E, 4C)。此外,作者进一步发现参考数据集中识别的IC标记基因与验证集相对应(图6F)。此外,JCA结果表明参考队列中观察到的所有强空间相关性都在验证样本中得到了证实(图6G-H)。
7. TNBC空间转录组揭示种族差异
在文章的最后一部分研究分析了IC的种族差异。研究发现白种人样本中IC3、IC6和IC8的比例较高,而IC5、IC7和IC9的则主要是美国非裔(AA)样本(图7A),且白种人的IC3明显高于AA样本,而AA样本的IC5也显著更高(图7B)。作者进一步对IC3和IC5进行分析,CIBERSORTx结果表明IC3在白种人样本中淋巴细胞和巨噬细胞含量显著更高,而AA样本的整体免疫细胞含量较低(图7C-D)。接着研究验证了IC5与AA和白种人样本中高缺氧评分的特征相关(图7E),且具有高肿瘤纯度评分的特征(图7F)。此外,研究也发现在验证队列中NDRG1与IGKC在AA特征的IC5中表达更高(图8A),其中IGKC高表达具有保护作用(图8B-D)。相反,NDRG1的高表达与较差的预后相关(图8E)。
到这里这篇文章的主要内容就介绍完了,文章对空间转录数据进行分析识别出了TNBC的一个保守的空间结构。文章的分析方法并不难,但亮点在于使用了热点的空间转录组数据,毕竟空间转录组测序技术解决了组织测序难以区分不同细胞的基因表达情况,以及单细胞转录组无法解决细胞原始位置表达的难题。如今空间转录组数据越来越多,小编觉得做单细胞的小伙伴们也可以考虑加入空间转录组分析,毕竟研究切入热点可能会产生事半功倍的效果。