寻找基因的CDS, 5'UTR,3'UTR及Promoter区
由于实验需要,最近看了很多这方面的资料,这里做个汇总。首先看下摘自WIKI的这张图有个大概的了解。
一、CDS,5'UTR 和 3'UTR的寻找
由上图可知,5'UTR 和 3'UTR虽然是基因上不被翻译的区域,但他们本身属于Exon,因此找出他们的序列很简单。如我现在要寻找human LDLR(人源低密度脂蛋白受体)这个基因的5’UTR及3'UTR,我直接在NCBI的GENE里面输入LDLR,然后找human的这个GENE,显示如下:
看到这个页面后,下拉寻找LDLR的mRNA序列信息 点击下图的NM_000527.4,便可得到LDLR的mRNA全序列。
看到Homo sapiens low density lipoprotein receptor (LDLR), transcript variant 1, mRNA后,往下拉菜单,会发现CDS的信息,直接点击CDS,下方的CDS序列则被深红标出,而CDS前面180多bp则为LDLR的5’UTR,而CDS后面2000多bp的则为LDLR的3‘UTR:
1.http://www.mybioinfo.info/
2.http://rulai.cshl.edu/cgi-bin/TRED/tred.cgi?process=home
对这个结果我在软件DNA MAN NCBI上 RUN BLAST来确认,结果显示是Accession number 为
3.介绍个更靠谱的吧,UCSD的。http://genome.ucsc.edu/
UCSD这个有一个帖子专门介绍如何使用,点击页面左上角的Genome brower,然后进入基因信息输入页面。还是以LDLR为例。
点击submit就可以得到一系列LDLR的信息:
Ensembl Gene Predictions路径由Ensembl提供。若初次尝试得不到Ensembl,则可下拉菜单将Ensembl Genes选择为dense
promoter, 5'UTR, CDS, 3'UTR, INTRONS 啥都出来了,想要啥就打啥勾submit就行了。promoter的话,5’上游2000bp应该够了,这个结果我blast 过,是对的。
好吧,先记录到这里吧,应该会有很多方法来寻找的,欢迎指正补充哈~~~另外,推荐一个不错的网站:叫biology online,有什么问题可以发上去,会有人回复的,前提是这是个英文网站,so,ask questions by English!~
http://www.biology-online.org/biology-forum/about10668.html
原文地址:http://blog.sina.com.cn/s/blog_858e1af101011ofl.html
点击阅读原文前往
欢迎关注生信人