今天和大家一起来看一篇在33种肿瘤中的综合生物信息学分析人白细胞抗原(HLA)与免疫亚型、致癌通路及免疫治疗反应关系的文章“Pan-cancer HLA Gene-mediated Tumor Immunogenicity and Immune Evasion”,发表在《Mol Cancer Res》,2022年影响因子6.333分。(文末附TCGA35个肿瘤项目全称及缩写)
研究背景
人白细胞抗原(human leukocyte antigen, HLA)表达通过与T细胞受体的相互作用有助于抗肿瘤免疫的激活。
HLA化学本质为一类糖蛋白,由一条α重链(被糖基化的)和一条β轻链非共价结合而成。其肽链的氨基端向外(约占整个分子的3/4),羧基端穿入细胞质,中间疏水部分在胞膜中。HLA按其分布和功能分为Ⅰ类抗原和Ⅱ类抗原。
HLA Ⅰ类抗原分布于所有有核细胞。这些抗原可被外来物质例如某种病毒或化学物质加以改变,当这些基因产物被改变之后,便成为自身免疫原,成为免疫排除的靶子。
HLA-Ⅱ类抗原主要表达于B细胞、巨噬细胞等抗原提呈细胞和活化T细胞表面, 识别和提呈外源性抗多肽,与辅助受体CD4结合,对Th的识别起限制作用,参与抗原提呈,启动免疫应答。
结果展示
HLA genes Are Differentially Expressed in Most TCGA Tumor Types, with the Expression of Class I Genes Higher than Class II.
HLA基因在大多数TCGA肿瘤类型中存在差异表达,I类表达高于II类。
作者首先分析了33种TCGA肿瘤类型中HLA I类、II类基因以及与MHC I重链相关的β -2微球蛋白(B2M) 的表达水平。如研究背景介绍,虽然HLA I类基因在有核细胞普遍表达,但HLA II类基因的表达仅限于抗原提呈细胞(Antigen-presenting cells, APCs)。在这篇文章中,作者发现B2M和HLA I类基因的表达水平高于II类基因(图1A)。与既往文献报道的一致,HLA-G和HLA-DO 存在组织限制性表达,作者观察到I类HLA-G和II类HLA-DO (HLA-DOA, HLA-DOB)表达最低。接下来,作者评估了肿瘤和正常样本间HLA I和II基因的表达差异。
在多形成性胶质细胞瘤( Glioblastoma, GBM), 食管癌 (Esophageal Cancer, ESCA), 乳腺浸润癌 (Breast Cancer, BRCA), 肝癌( Liver Cancer, LIHC), 肾嫌色细胞癌( Kidney Chromophobe, KICH), 胆管癌(Bile Duct Cancer, CHOL), 甲状腺癌( Thyroid Cancer , THCA), 肾乳头状细胞癌( Kidney Papillary Cell Carcinoma, KIRP), 头颈癌( Head and Neck Cancer, HNSC), 肾透明细胞癌( Kidney Clear Cell Carcinoma, KIRC)10种肿瘤类型HLA I类表达显著上调,在肺腺癌 ( Lung Adenocarcinoma, LUAD), 结肠癌 ( Colon Cancer, COAD), 肺鳞状细胞癌 ( Lung Squamous Cell Carcinoma, LUSC)3种肿瘤I类表达下调。
在肾透明细胞癌( Kidney Clear Cell Carcinoma, KIRC),肾乳头状细胞癌( Kidney Papillary Cell Carcinoma, KIRP),甲状腺癌( Thyroid Cancer, THCA),多形成性胶质细胞瘤( Glioblastoma, GBM),胆管癌(Bile Duct Cancer, CHOL),乳腺浸润癌 (Breast Cancer, BRCA) 6种肿瘤II类表达上调,在肺腺癌 ( Lung Adenocarcinoma, LUAD), 胰腺癌 ( Pancreatic Cancer, PAAD), 肺鳞状细胞癌 ( Lung Squamous Cell Carcinoma, LUSC), 肾嫌色细胞癌( Kidney Chromophobe, KICH),结肠癌 ( Colon Cancer, COAD), 直肠癌( Rectal Cancer, READ) 6种肿瘤II类表达下调(图1B-C)。其中,KIRC对HLA I类和II类基因表达上调最多,而LUSC对HLA基因表达下调最多。HLA基因差异表达的差异性可能与来源组织有关,反映了肿瘤特异性调控HLA基因表达机制的差异。
作者还比较了相同组织类型TCGA肿瘤与GTEx正常标本HLA I类和II类的表达情况。许多TCGA肿瘤样本HLA I类基因表达下调,其中LUSC和LUAD明显低表达。大多数TCGA肿瘤组织的HLA II类基因表达明显高于GTEx正常样本。作者推测这一结果可能由于GTEx正常样本来自健康供体,而TCGA肿瘤及肿瘤旁正常组织可能处于免疫抑制的微环境中,导致HLA I类基因的表达下调。
既往研究发现,HLA II类基因主要由APCs表达,在健康个体中APCs聚集在淋巴结和脾脏中。在感染或慢性炎症时,APCs被招募到炎症部位,并在周围形成三级淋巴器官(TLOs),进行局部抗原呈递和T细胞活化。因此,GTEx健康组织中APCs的含量可能比炎症肿瘤中APCs的含量更少,导致HLA II类基因总体表达降低。
HLA Class I and Class II Gene Expression Correlate with Tumor Immune Characteristics and Predict Cytolytic Activity.
HLA I类和II类基因表达与肿瘤免疫特性相关并可以预测细胞溶解活性
作者接下来评估了HLA基因表达是否与肿瘤的免疫特征相关,包括免疫浸润、促炎基因特征和免疫检查点特征。HLA I类和II类基因的表达均与抗肿瘤免疫特征有很强的相关性(图2A)。
HLA I类和II类基因与促炎基因表达呈正相关,与免疫检查点呈正相关。有趣的是,HLA基因表达与这些免疫特性的相关性强于TMB或肿瘤新抗原,后者通常用于预测免疫原性和治疗反应。此外,虽然TMB和肿瘤新抗原与细胞溶解活性(CYT)呈弱相关,但HLA基因表达与CYT之间的正相关更强(Spearman correlation, TMB: R=0.21; neoantigens: R=0.24; HLA I: R=0.62; HLA II: R=0.74)。
在经典和非经典HLA I类基因中,HLA-E与CYT的相关性最高(R=0.67),而HLA- G与CYT的相关性最低(R=0.43)(图2B)。HLA- DR与CYT的相关性最高(R=0.73),而HLA- DM与CYT的相关性最低(R=0.64)。根据HLA I和HLA II类基因表达数据的主成分分析(PCA)显示,溶细胞活性高的肿瘤汇聚在一起(图2C)。此外,作者以HLA I和HLA II类基因的表达水平为特征,进行随机森林分类器分析,对具有强细胞溶解活性的样本进行分类,准确率高(AUC=0.93),表明该表达数据具有预测出免疫原性热肿瘤的潜力。结果还发现,HLA-E、HLA-DQA1和HLA-DRA具有最高的relative feature importance,而HLA-G的relative feature importance最低。总的来看,在作者进行的研究中,HLA I类和II类基因的表达与肿瘤免疫原性密切相关,并可能优于TMB作为预测肿瘤免疫活性的临床指标。
HLA Allelic Diversity in Tumors with High HLA Expression Correlates with Improved Survival.
HLA高表达肿瘤中HLA等位基因多样性与生存率的提高相关
MHC-I类分子是高度可变的,在提呈抗原的过程中具有不同的理化性质。接下来,作者评估了HLA I类超家族在TCGA肿瘤中的表达情况。HLA I类超家族在不同肿瘤间的表达分布是对称的(图3A)。在HLA -A中,A24的突变频率最低,而在HLA-B中,B8、B27、B58和B62的突变频率最低。HLA I类基因的表达没有显著差异,这个结果提示个体的特定HLA类型与HLA基因表达无关。此外,不同HLA超家族之间的免疫浸润、促炎基因表达和免疫检查点表达具有可比性。在HLA I基因中,HLA-B等位基因组与患者生存率显著相关,B*15 (Cox proportional-hazards, HR=1.79, p=0.021)和B*50与患者预后差显著相关(HR=21.15, p=0.003)。由于HLA- B是所有三个HLA I类基因位点中最具多样性的,这可能是导致不同预后的主要原因。
由于患者的HLA等位基因的多样性可能会产生更多的新抗原,从而增加肿瘤被免疫排斥的可能性,作者进一步分析HLA等位基因多样性是否与肿瘤免疫原性相关。用HLA-I进化分化(HED)评分评估每个患者的HLA-I类等位基因的理化性质。所有三个HLA I位点纯合子的患者HED评分为0。结果发现,HLA I等位基因功能多样性越高,患者HED评分越高。所有患者的中位HED为6.66,低为0,高为11.54(图3B)。但是没有观察到HLA I等位基因多样性与TME中免疫细胞、促炎基因或免疫检查点浸润水平之间的相关性。
作者推断,如果HLA基因表达水平低,那么较高的等位基因多样性可能不利于提呈肿瘤新抗原。因此,作者提出在HLA I类基因高表达的肿瘤中,HLA I等位基因的高等位变异可能会更有效地提呈肿瘤新抗原并促进抗肿瘤免疫反应。为了验证这一假设,作者根据HED评分和HLA I类基因的表达水平将所有患者分为四个象限(图3C)。HLA I类基因高表达和高HED评分显示明显更好的生存 (图3D)。此外,在四个象限中,仅高HLA I(象限IV)或高HED(象限II)与生存没有显著相关性(图3E)。最后结论是,在HLA I类基因高表达的肿瘤中,HLA I等位基因多样性高与患者较好的预后相关。
HLA Class I and Class II Genes Show Differential Expression Patterns across Various Immune Microenvironments with Different Survival Outcomes.
HLA I类和II类基因在不同的免疫微环境中表现出不同的表达模式,具有不同的生存结果
接下来,作者分析了HLA基因表达在各种肿瘤的免疫微环境中是否有差异。为此,作者在肿瘤与其匹配的正常样本中进行比较6种免疫亚型(C1-C6)中HLA I类和II类的差异基因表达。这些6种亚型来自160个免疫表达特征 (不包括HLA基因) :C1(伤口愈合)、C2 (IFN-γ优势)、C3(炎症)、C4(淋巴细胞耗尽)、C5(免疫静默)和C6 (TGF-β优势)。C2和C3的特点是抗肿瘤I型免疫反应。C5的免疫浸润评分最低,而C4和C6的肿瘤患者预后最差,且肿瘤微环境以巨噬细胞浸润为主。作者发现HLA I类基因表达在C2和C3上调,而在C5显著下调 (图4A, 4C)。
既往研究报道C2和C3亚型的肿瘤组织免疫浸润评分最高,而C5亚型免疫浸润特征最近低。HLA -II类基因表达在C1、C4和C5亚型的肿瘤中显著下调 (图4B-C)。令人惊讶的是,虽然C2和C3都是免疫浸润“热肿瘤”,但HLA -II类基因在C3亚型中显著高表达,这表明HLA- I类基因上调和两类HLA基因均上调具有不同的免疫微环境特征。
HLA- I类分子与CD8 +T细胞之间存在相互作用,而II类分子与CD4+辅助T细胞之间存在相互作用。作者进一步评估HLA -I类和II类基因上调是否与辅助T细胞和细胞毒性T细胞介导的适应性免疫相关。HLA-II类基因上调的患者Th1细胞水平明显高于HLA-II类基因低表达的患者(图4D)。相比之下,HLA I类基因的表达水平与Th1细胞水平只有较低的相关性。另一方面,高表达HLA-I类基因和HLA-II类基因与细胞溶解活性评分的增加和CD8+ T细胞浸润水平存在相关性。虽然HLA- I类和II类基因的上调均与细胞毒性T细胞介导的免疫有关,但作者的研究结果表明,HLA- II类基因的上调与辅助T细胞介导的免疫有很强的相关性,这可能会导致促进肿瘤微环境中T细胞增强细胞溶解活性,发挥更强的抗肿瘤免疫。
作者考虑HLA基因表达数据是否可以用来预测肿瘤样本的免疫亚型。作者利用HLA I类和II类基因的转录组数据进行人工神经网络模型分析,预测6种免疫亚型。结果发现该模型能够准确预测肿瘤的免疫亚型 (图4E)。在6种免疫亚型中,C3和C5的分类准确率最高, C6的分类准确率最低。总之,结果表明,HLA- I类和II类基因有可能预测肿瘤中不同类型的免疫微环境
作者还分析了HLA基因表达是否可以预测患者的预后。结果发现,溶细胞活性、TMB和肿瘤新抗原均无法预测患者的预后,相比而言,HLA – II类基因可以预测患者的预后 (图4F)。此外,在单个肿瘤类型中,LUAD和BRCA的HLA-II类基因高表达与较好的预后相关。其他肿瘤类型(KIRC、THCA、COAD、UCEC、ESCA、HNSC、LIHC、BLCA)的HLA-II类基因高表达也与较好的预后相关,但相关性无统计学意义。结果得出,HLA -II类基因的上调与抗肿瘤免疫反应相关,与较好的预后相关。
DNA Methylation near HLA Class I Genes Favored under Strong Cytolytic Activity Can Be Alleviated by Class II Gene Upregulation.
细胞溶解活性强的HLA I类基因的DNA甲基化可以通过上调II类基因来缓解
HLA类基因的DNA甲基化水平改变已被证明是一种潜在的HLA介导的肿瘤逃逸策略,可下调HLA类基因表达并抑制免疫反应。作者首先评估了HLA -I类基因不同甲基化水平对免疫的影响。总体而言,HLA- I表达与甲基化水平呈显著负相关。溶细胞活性高的肿瘤HLA -I基因出现低甲基化改变,而溶细胞活性低的肿瘤发生高甲基化(图5A)。此外,作者观察到不同免疫亚型HLA -I类基因的甲基化水平不同 (图5B)。C1(伤口愈合)和C4(淋巴细胞耗尽)中HLA -I类基因表达较低,C1和C4中HLA- I类基因的甲基化水平升高。与C3(炎症)肿瘤相比,C2 (IFN-γ优势)肿瘤的HLA- I类基因的甲基化水平明显更高,尽管HLA- I类基因表达水平是一致的。这表明,虽然C2和C3肿瘤均存在HLA- I类基因高表达,但C2肿瘤HLA I类基因甲基化水平变高。
作者关注C2和C3亚型的肿瘤,这两种肿瘤都是以I型免疫反应为主。溶细胞活性高的C2肿瘤,其HLA -I类基因的甲基化程度明显高于C3肿瘤,而溶细胞活性低的肿瘤,其HLA- I类基因的甲基化程度相当(图5C)。这表明,在强烈的免疫活性下,具有I型免疫反应的肿瘤的HLA- I类基因的甲基化水平增加,以逃避免疫识别。由于HLA -II类基因在C3中显著上调,作者分析了更高的HLA- II类基因的表达是否会降低肿瘤中HLA- I类基因的甲基化水平。HLA-II类基因高表达的肿瘤,甲基化水平明显高于HLA-II类基因低表达的肿瘤 (图5D)。作者的研究结果支持HLA- II类基因上调可能是肿瘤微环境改善肿瘤免疫逃逸和触发有效抗肿瘤免疫的机制。
HLA Loss of Heterozygosity (LOH) Is Associated with Worse Survival but Can Be Counter Balanced by High HLA Expression.
HLA杂合性缺失(LOH)与较差的生存率相关,但可以通过高表达来平衡
HLA- LOH是一种潜在的HLA介导的肿瘤免疫逃逸策略,作者分析了它与HLA类基因表达和患者预后的相关性。作者重点研究了BRCA、LUAD和SKCM这三种具有免疫治疗潜力的常见癌症类型。
结果发现,HLA - LOH与预后差存在相关性。在BRCA和SKCM患者中,HLA - LOH与患者的预后无显著相关性,而在LUAD患者中,HLA - LOH与较差的预后相关。
接下来,作者的分析发现具有HLA - LOH的肿瘤更容易逃避免疫识别。高溶细胞活性的肿瘤含有更多的HLA LOH (图6A)。在5种免疫亚型中,C2 (IFN-γ优势)肿瘤中HLA - LOH的比例最高,而C3(炎症)肿瘤中HLA - LOH的比例最低 (图6B)。尽管C2和C3肿瘤都具有I型免疫反应的特征,但C2型肿瘤含更多的HLA LOH。令人惊讶的是,并没有发现HLA -I类基因的拷贝数与基因表达之间存在相关性 (图6C)。也没有发现HLA -I类基因表达水平与LOH之间的存在相关性。这表明HLA- I类基因在RNA水平上的表达与DNA水平上HLA I等位基因的丢失不相关。HLA LOH很可能不会下调HLA类基因的总表达。基于HLA类基因缺失可能导致肿瘤新抗原的丢失,促使肿瘤发生免疫逃逸,作者分析了HLA基因高表达是否可能弥补肿瘤新抗原递呈的减少。有趣的是,在HLA- I类基因低表达、HLA- LOH的肿瘤中,患者预后较差,而在HLA-I高表达、HLA- LOH的肿瘤中,患者预后无差异(图6D)。总之,HLA LOH与较差预后的相关性受到HLA基因表达水平的影响。
结论
本文作者分析了HLA基因表达水平,HLA基因超家族表达水平与肿瘤患者免疫微环境的相关性,以及与肿瘤患者预后的相关性,根据HLA基因的表达对肿瘤患者进行分型,发现不同HLA分型的肿瘤患者预后存在差异,这种改变可能与HLA介导的肿瘤免疫相关。
附TCGA35种肿瘤项目缩写:
肾上腺皮质癌 ( Adrenocortical Cancer, ACC) ; 膀胱尿路上皮癌 ( Bladder Cancer, BLCA);乳腺浸润癌 (Breast Cancer, BRCA); 宫颈鳞癌和腺癌 (Cervical Cancer, CESC); 胆管癌(Bile Duct Cancer, CHOL); 结肠癌 ( Colon Cancer, COAD); 结直肠癌( Colon and Rectal Cancer, COADREAD); 弥漫性大B细胞淋巴瘤( Large B-cell Lymphoma, DLBC);食管癌 (Esophageal Cancer, ESCA); FFPE试点二期 (FFPE Pilot Phase II, FPPP);多形成性胶质细胞瘤( Glioblastoma, GBM); 胶质细胞瘤( lower grade glioma and glioblastoma, GBMLGG);头颈癌( Head and Neck Cancer, HNSC); 肾嫌色细胞癌( Kidney Chromophobe, KICH); 肾透明细胞癌( Kidney Clear Cell Carcinoma, KIRC); 肾乳头状细胞癌( Kidney Papillary Cell Carcinoma, KIRP); 急性髓系白血病 ( Acute Myeloid Leukemia, LAML); 脑低级别胶质瘤 (Lower Grade Glioma, LGG); 肝癌( Liver Cancer, LIHC); 肺腺癌 ( Lung Adenocarcinoma, LUAD); 肺癌 ( Lung Cancer, LUNG); 肺鳞状细胞癌 ( Lung Squamous Cell Carcinoma, LUSC); 间皮瘤 ( Mesothelioma, MESO; 卵巢癌( Ovarian Cancer, OV); 胰腺癌 ( Pancreatic Cancer, PAAD); 泛癌 ( Pan-Cancer, PANCAN);嗜铬细胞瘤和副神经节瘤 (Pheochromocytoma & Paraganglioma, PCPG); 前列腺癌( Prostate Cancer, PRAD); 直肠癌( Rectal Cancer, READ); 肉瘤( Sarcoma, SARC); 皮肤黑色素瘤( Melanoma, SKCM); 胃癌( Stomach Cancer, STAD); 睾丸癌 (Testicular Cancer, TGCT); 甲状腺癌( Thyroid Cancer, THCA); 胸腺瘤( Thymoma, THYM); 子宫内膜样癌 ( Endometrioid Cancer, UCEC); 子宫癌肉瘤( Uterine Carcinosarcoma, UCS); 眼部黑色素瘤( Ocular melanomas, UVM).