DNA序列查询——NCBI良心教程,寻找基因转录本序列及相关编码蛋白
时间:2021-08-21 阅读:24090
提及 NCBI 我们大家都不陌生,研究物种基因功能可都靠它呢。在 NCBI 的快速搜索下,基因 转录本序列以及相关编码蛋白信息那也是手到擒来。然而当我们查找某个基因的相关信息时, 就会发现该基因有很多个转录本。所以尽管基因查询很简单,但要精确定位到自己所需的转 录本核酸序列及蛋白信息仍是一个问题,今天小编就手把手教大家如何通过经 NCBI 搞定此难题,以栗子为主,包学包会。
步骤
1.打开 pubmed:ncbi.nlm.nih.gov/pubmed
2.选择基因并输入你要查找的基因名称 ,这里以 TP53 基因为例:
3.点击 search 进入该界面
4.点击第一个 TP53 进入以下界面
5.下拉到 NCBI Reference Sequences (RefSeq)区域,mRNA and Protein(s)下显示的就是该基因的转录本及其编码的蛋白:
6.一直下拉会发现该基因共有15个转录本
案例
以第一个转录本为例来告诉大家怎样查找转录本的核苷酸序列及其编码的蛋白质的氨基酸序列。
7.点击 NM_000546.5 后会出现以下界面
8.下拉到 ORIGIN 区域即为该转录本的核苷酸序列
9.返回到以下界面
10.点击 NP_000537.3 后会看到以下界面
11.下拉到 ORIGIN 区域即为该转录本编码的蛋白质的氨基酸序列
获得该转录本的 ORF 序列
12.返回到以下界面
13. 点击 CCDS11118.1 后会出现
14.下拉到 Nucleotide Sequence 区域即为该转录本的 ORF 序列,Translation 区域是该转录本编码的蛋白质的氨基酸序列。
NCBI 数据库中搜索基因序列的私家套路三
套路一
进入NCBI 网站,在 Nucleotide(核苷酸)数据库中搜索,以人 CCL2 为例。
套路二
进入 NCBI 网站,在 CCDS( 共识编码序列 )数据库中搜索,ncbi.nlm.nih.gov/projects/CCDS/CcdsBrowse.cgi
套路三(推荐)
进入 NCBI 网站,在 Gene(基因)数据库中搜索。找到 Tools 工具的下拉菜单中 Sequence Text View,点击就可以查到基因序列,并且网站以不同颜色标注 CCL2 基因的不同部分,灰色的 UTR,红色的外显子,绿色的内含子,以及一一对应的编码区。