8个NAR数据库速览:用好这些数据库,文章让你发到吐
生命科学研究始终离不开各种生物数据库的发展,其中最著名的当属NCBI。Nucleic Acids Research(IF=16.974) Database 专刊于2021年发表了一系列重磅数据库,包括细胞药物应答、癌症药物反应、癌症miRNA、癌症可变剪切等多种当下研究热点,今天小编带大家一起阅览一下8个数据库。
1.CeDR Atlas: 细胞药物应答知识库
访问地址:https://ngdc.cncb.ac.cn/cedr
文章:CeDR Atlas:a knowledgebase of cellular drug response
数据库简介:基因组具有复杂的功能特征,因此药物对许多疾病的反应与应答差异很大。人体组织,特别是肿瘤的细胞多样性,是导致不同样本药物反应不同的主要因素之一。随着单细胞RNA测序数据的积累,现有数据有可能在单细胞分辨率下研究药物对不同治疗的反应。作者展示了CeDR Atlas,报告了来自不同组织的数百种细胞类型的细胞药物反应的计算推断。作者利用了通过Connectivity Map资源(CMap)获得的药物诱导基因表达的高通量分析,以及涵盖各种器官/组织、疾病和不同生理或病理条件下的数百个scRNA-seq数据。目前,CeDR Atlas涵盖了人类、小鼠和细胞系的582个单细胞数据对象的结果,包括约140个表型和1250个组织细胞组合类型。所有的结果都可以通过药物、细胞类型、组织、疾病和特征基因等关键词进行探索和搜索。总的来说,在细胞分辨率上,CeDR Atlas精细地描绘了药物反应,并阐明了组合治疗、耐药性甚至药物副作用。
2.CTR-DB:一个与癌症药物反应相关的基因表达特征综合数据库
访问地址:http://ctrdb.ncpsb.org.cn/
文章:CTR-DB, an omnibus for patient-derived gene expression signatures correlated with cancer drug response
数据库简介:到目前为止,只有部分癌症患者能从化疗和靶向治疗中获益,耐药仍然是当前癌症研究面临的主要和具有挑战性的问题。快速积累的与癌症药物反应相关的患者临床转录组数据为探索药物反应的分子决定因素带来了机遇,但同时也对数据的管理、整合和重用提出了挑战。作者提出了癌症治疗反应基因特征数据库,供基础和临床研究人员访问、整合和重复使用癌症药物反应的临床转录组。CTR-DB收集并统一重新处理了83个患者来源的治疗前转录组源数据集,其中包括28种组织学肿瘤类型、123种药物和5139个患者样本。这些数据是可浏览、可搜索和可下载的。此外,CTR-DB支持单数据集探索(包括差异基因表达、受试者工作特征曲线(ROC)、功能富集、致敏药物搜索、肿瘤微环境分析)、多数据集组合比较以及生物标志物验证功能。这为耐药机制、预测性生物标志物的发现和验证、药物联合和耐药机制异质性提供了深入的见解。
3.CancerMIRNome:人类癌症miRNA交互式分析与可视化数据库
访问地址:http://bioinfo.jialab-ucr.org/CancerMIRNome
文章:CancerMIRNome: an interactive analysis and visualization database for miRNome profiles of human cancer
数据库简介:miRNA在基因调控网络中发挥着重要作用,已经成为人类癌症诊断和预后的非常有前景的生物标志物,特别是在循环血液中分泌的miRNA以非常稳定的形式存在,并有巨大的潜力作为早期癌症检测的非侵袭性生物标志物。目前迫切需要新颖和用户友好的工具来促进从癌症基因组图谱(TCGA)和大规模循环miRNA谱研究中的大量miRNA表达数据中进行数据挖掘。为了填补这一空白,作者开发了综合的数据库CancerMIRNome,用于miRNA表达谱的交互分析和可视化,基于来自33个TCGA项目的10554个样本和来自40个公开流通miRNome数据集的28633个样本。一系列尖端生物信息学工具和机器学习算法已被打包在CancerMIRNome中,允许对多个癌症类型的感兴趣的miRNA进行泛癌分析或对miRNome谱进行全面分析,以识别失调的miRNA,并开发诊断或预后特征。数据分析和可视化模块将极大地促进有价值资源的开发,促进miRNA生物标志物在癌症中的转化应用。
4.Regeneration Roadmap:再生生物学多组学数据资源库
访问地址:https://ngdc.cncb.ac.cn/regeneration/index
文章:Regeneration Roadmap: database resources for regenerative biology
数据库简介:随着细胞重编程、基因编辑、合成生物学、高通量测序等技术的快速发展,再生生物学进入前所未有的蓬勃发展时期,助力解决组织替代、功能修复、衰老干预、疾病治疗等一系列生命医学领域的重要科学难题。面对科学数据的爆炸式增长,亟需建立以再生生物学为核心的开放数据库,以存储世界范围内的组学研究数据为基础,推动再生相关的基础研究和临床转化应用的不断发展。Regeneration Roadmap从转录组、单细胞转录组、表观基因组及药物基因组等不同层面整合了再生相关数据集,涉及11个物种、36种组织类型,实现了不同条件下基因表达随再生变化的汇聚融合,以及对不同层次组学数据的交互查询和联合比较分析。此外,数据库收录了基于已有文献报道的再生相关基因集,使得用户可以更加深入全面地了解特定基因或通路在再生生物学中的功能。
5.Gene Expression Nebulas:整合多物种的bulk与单细胞转录组数据库
访问地址:https://ngdc.cncb.ac.cn/gen/
文章:Gene Expression Nebulas (GEN): a comprehensive data portal integrating transcriptomic profiles across multiple species at both bulk and single-cell levels
数据库介绍:转录组分析对于从转录和转录后方面揭示功能至关重要。可开放获取的数据门户Gene Expression Nebulas整合了各种生物背景下的转录组概况,GEN通过使用标准化的数据处理管道和结构化的管理模型,提供了高质量的bulk和单细胞RNA测序数据集的管理集合。目前,GEN储存了来自323个数据集(157个bulk数据集和166个单细胞数据集)的基因表达谱,涵盖了30个物种的50500个样本和15540169个细胞,这些细胞进一步分为6个生物条件。此外,GEN为10个bulk数据集集成了表达、RNA编辑和选择性剪接的完整的转录组谱,为用户提供了在转录和转录后水平进行整合分析的机会。此外,GEN还提供了丰富的基因注释,并提供在线数据分析和可视化服务。总的来说,GEN提供了跨多个物种的转录组谱的综合收集,从而为更好地理解从组织到细胞的遗传调控结构和功能机制提供了基础资源。
6.OncoSplicing:人类癌症中临床相关的可变剪接数据资源库
访问链接:www.oncosplicing.com
文章:OncoSplicing: an updated database for clinically relevant alternative splicing in 33 human cancers
数据库简介:选择性剪接(alternative splicing)是mRNA水平上调控基因表达的一种重要方法,有助于提高蛋白质的复杂性。据报道,异常剪接在包括癌症在内的几种疾病中发挥作用。OncoSplicing数据库用于可视化生存相关的可变剪接事件。基于TCGA SpliceSeq项目中33种癌症的122423例AS事件和TCGA SplAdder项目中32种癌症的238558例AS事件,提供了OncoSplicing的更新版本,以综合看待临床相关的可变剪接。新版本的数据库包含几个有用的功能,如可变剪接相关转录本的注释、基于中值和最佳截断的生存分析、TCGA肿瘤样本与相邻正常样本或GTEx正常样本之间的差异分析、可变剪接的泛癌视图、剪接差异和Cox'PH回归结果、临床指标相关和癌症特异性剪接事件的识别、SplAdder项目中可下载的剪接数据。总的来说,OncoSplicing的基本更新版本是一个用户友好且无需注册的数据库,用于浏览和搜索人类癌症中临床相关的可变剪接。
7.SPENCER:癌症病人非编码RNA编码的生物活性短肽数据库
访问地址:http://spencer.renlab.org
文章:SPENCER: a comprehensive database for small peptides encoded by noncoding RNAs in cancer patients
数据库简介:随着越来越多的非编码RNA(ncRNA)被发现可以编码肿瘤中的生物活性短肽,对ncRNA编码的短肽(ncPEPs)的探索正成为癌症研究的一个令人着迷的领域。SPENCER数据库帮助研究ncPEPs的调控机制。目前,SPENCER已经从55项研究中收集了2806个质谱数据点,涵盖1007个肿瘤样本和719个正常样本。使用基于MS的蛋白质组学分析管道,SPENCER在15种不同的癌症类型中鉴定了29526个ncPEPs。具体来说,22060个ncPEPs在其他研究中得到了实验验证。通过比较肿瘤和正常样本,将鉴定出的ncPEPs分为四个表达组:肿瘤特异性表达组、癌中上调表达组、癌中下调表达组和其他表达组。此外,由于ncPEPs是基于新抗原的癌症免疫治疗的潜在靶点,SPENCER还通过评估其MHC-I结合亲和性、稳定性和TCR识别概率来预测所有已鉴定的ncPEPs的免疫原性。因此,有4497个ncPEPs被预测为免疫原性的。总的来说,SPENCER将是研究癌症相关的ncPEPs的有用资源,并可能促进癌症的进一步研究。
8.TISMO:肿瘤免疫同基因小鼠
访问地址:http://tismo.cistrome.org
文章:TISMO: syngeneic mouse tumor database to model tumor immunity and immunotherapy response
数据库简介:同基因小鼠模型是由移植在具有相同遗传背景的小鼠品系上的小鼠癌细胞产生的肿瘤,被广泛应用于研究肿瘤免疫和在全功能的小鼠免疫系统背景下的免疫治疗反应。尽管缺乏系统的收集和分析使得数据的重用具有挑战性,但在不同的免疫治疗下已经产生了大量的同基因小鼠肿瘤表达谱。TISMO是一个具有交互式可视化功能的同基因小鼠模型的广泛收集的数据库,包含来自23种癌症类型的49个同基因癌细胞系的605个体外RNA-seq样本,其中195个接受了细胞因子治疗。TISMO还包括来自19种癌症类型的68个同基因小鼠肿瘤模型的1518个体内RNA-seq样本,其中832个来自免疫检查点阻断(ICB)研究。手工标注了样本元数据,如细胞系、小鼠品系、移植部位、治疗和应答状态等,并统一处理和质量控制RNA-seq数据。除了数据下载,TISMO还提供交互式网络界面,以研究特异性基因表达、途径富集或免疫浸润水平是否与差异免疫治疗反应相关。