如何在 NCBI 上进行菌种的同源性比对
时间:2021-08-23 阅读:6516
当我们将未知菌株送到公司测序时,并不意味着公司会直接告诉我们未知菌株是什么种什么属的,他们只会给你未知菌株的测序序列,这时候就需要我们自己在 NCBI 上进行同源性比对。
下面结合实验经历跟大家交流一下。 首先,我们先来弄清楚几个概念:
Query:数据库中的序列
alignments: 比对上的两个序列
hits:两个序列比对上的片段
Score:比对得分,如果序列匹配上得分,不一样,减分,分值越高,两个序列相似性越高
E Value:相对的一个统计值,值越小,越可信
Length:输入序列的长度
Identities:一致性,就是两个序列有多少是一样的
Accession:登录号
NCBI 网站:blast.ncbi.nlm.nih.gov/Blast.cgi
操作步骤
1、打开上述网站,出现图 1 页面,
图1
点击,进入图 2 页面,
图2
2、在图 2 界面的
输入序列, 这里以JF439461//CTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGAT CATTACCGAGTGCGGGTCCTTTGGGCCCAACCTCCCATCCGTGTCTATTGTACCCTGTTGCTTCGGCGGGCCC GCCGCTTGTCGGCCGCCGGGGGGGCGCCTCTGCCCCCCGGGCCCGTGCCCGCCGGAGACCCCAACACGA ACACTGTCTGAAAGCGTGCAGTCTGAGTTGATTGAATGCAATCAGTTAAAACTTTCAACAATGGATCTCTTG GTTCCGGCATCGATGAAGAACGCAGCGAAATGCGATAACTAATGTGAATTGCAGAATTCAGTGAATCATCGA GTCTTTGAACGCACATTGCGCCCCCTGGTATTCCGGGGGGCATGCCTGTCCGAGCGTCATTGCTGCCCTCAA GCCCGGCTTGTGTGTTGGGTCGCCGTCCCCCTCTCCGGGGGGACGGGCCCGAAAGGCAGCGGCGGCACC GCGTCCGATCCTCGAGCGTATGGGGCTTTGTCACATGCTCTGTAGGATTGGCCGGCGCCTGCCGACGTTTTC CAACCATTCTTTCCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGA GGA为例。
选中页面下的
然后点击 BLAST。出现图 3 和图 4 的页面(图 3 和 4 是同一页面的上下两部分)。
图3
图4
3、在图 3 页面上
表示你可以调整参数,重新比对或者保存搜索条件以便下次比对,调整报告显示的参数,以更符合你的要求、下载你比对的结果。
表示比对的标题,优先是 你填写的,如果没有填写可能是你输入 fasta 序列头(大于号后面的),如果这个也没有找到, NCBI 会自动生成一个。
表示你输入序列的信息,包括标识号、描述信息、类型、长度。
表示你可以查看其他报告,比如摘要、分类、距离树等。
4、在图 4 的页面上 Ident 越高,表明序列的同源性也就越高。通过同源性较高的描述你可以初步判断未知菌株的类别。点击同源性较高的,比如我们点开第一个,出现图 5 的页面,将滚动条向下拉至图 6,得到比对同源性高的序列,将其登录号以及序列保存在文本文档中, 通过系统发育树我们能具体判别未知菌株属于哪种菌株。
图5
图6