收藏|基于表达谱研究疾病七大思路汇总
生信干货
sxr ·2020年9月22日 00:45
昨天我们推广的疾病的分析思路,火爆网络,索性今天再来一个返场小段,供大家消遣一下。因为大部分的疾病不致死,或者说预后部分的信息收集并不全面,所以在做生信分析的时候跟肿瘤相比,就缺了最重要的一步预后效果验证如何。我们之前说过肿瘤筛选marker有三大步骤,差异,降维,预后。小编今天通过对AD研究的几篇文章来简单介绍下如果没有预后,我们如何研究,如何分析。

Identification of molecular signatures and pathways to identify novel therapeutic targets in Alzheimer's disease: Insights from a systems biomedicine perspective核心基因是公号去年推广的一个免费视频,简单说来就是GEO数据筛选差异,通过网络降维,然后TCGA预后验证。但是如果对于疾病没有了预后,通常我们会增加TF、miRNA、Drug等因子的研究,筛序到核心的基因,再拓展下相关的因子、药物等等。
Identification of KIAA0513 and Other Hub Genes Associated With Alzheimer Disease Using Weighted Gene Coexpression Network Analysis(Froniter in genetics IF: 3+)这篇文章研究的是颞叶皮层AD样本的WGCNA分析,筛选到核心模块和基因之后,还是缺点东西,所以作者选择了去用其他的组织样本进行表达验证,甚至用了老鼠的样本。同时,作者深知分析内容不够,生信来凑的实际情况,于是这篇文章的图,超级精美。
看到这有小伙伴就说了,难道不能WGCNA筛选降维之后,看看多因子么,当然可以。Screening and Identification of Potential Peripheral Blood Biomarkers for Alzheimer’s Disease Based on Bioinformatics Analysis (medical science monitor IF: 1.9+)还记得小编说过的吧,要保证思路、分析、数据至少有一个不一样。这篇文章也是WGCNA,虽然后面成了多因子,但是呢如果样本也都一样,还是有作弊的嫌疑。分析内容为筛选差异,WGCNA筛选核心基因和模块,富集分析,然后针对核心基因找多因子分析。Integrated identification of key genes and pathways in Alzheimer’s disease via comprehensive bioinformatical analyses这个是什么意思呢,就是筛选差异,做完降维之后,更多的放在富集分析上,多做些富集分析的内容,不往后走了。Systematic Characterization of Circular RNA-Associated CeRNA Network Identified Novel circRNABiomarkers in Alzheimer’s Disease(Frontiers in Bioengineering and Biotechnology IF: 3.6)这个不多说,跟多因子的思路差不多,不过由于ceRNA研究涉及到lcnRNA就得验证,所以人家作者挑战了高难度选择了circRNA,这样不验证的理由可以是数据少喽,轻松过关。换句话说,做这个思路不管是数据多少,其实就是辛苦活了,堆了很多的数据。The data analyzed in this study were obtained from the GSE5281, GSE1297, GSE12685 GSE16759。Identification of Blood Biomarkers for Alzheimer’s Disease Through Computational Prediction and Experimental Validation(Frontiers in Neurology IF: 2.8)寻找marker ,降维,构建模型来做诊断模型,这个很经典,但是很难找到合适的数据验证的时候,就得需要通过实验来验证了,这个思路也很不错。
有小伙伴问了,如果诊断数据不够,我又想做诊断模型,应该怎么做。我建议你提高难度系数,做lncRNA的诊断模型,同时构建诊断模型的时候选择一些高级的模型构建方法,比如这一篇。Analysis of long noncoding RNAs highlights region-specific altered expression patterns and diagnostic roles in Alzheimer’s disease( briefings in bioinformatics IF: 8.9)通过整合芯片的原始数据,构建lncRNA的表达谱数据,然后筛选差异的lncRNA,构建基于lncRNA的诊断模型。差异的lncRNA+SVM,效果确实好啊。
