DNA序列比对——Blast,序列比对界中的先锋!
时间:2021-08-23 阅读:5707
NCBI 中的 Blast 被誉为序列比对界中的先锋,并非浪得虚名的,它多才多艺(功能多样),博学多识(比对面面俱到),还广交天下名人雅士(可获得各大数据库的信息)。 今天,小编让大家见识一下老大的风采。
首先,登陆 blast 主页blast.ncbi.nlm.nih.gov/Blast.cgi
Blast导航主页面主体包括三部分 BLAST Assembled Genomes、Basic BLAST和Specialized BLAST。
BLAST Assembled Genomes:就是让你选择你要对比的物种,点击物种之后即可进入对比页面。
Basic BLAST 包含 5 个常用的 Blast:
1.BLASTP 是蛋白序列到蛋白库中的一种查询。
2.BLASTX 是核酸序列到蛋白库中的一种查询。
3.BLASTN 是核酸序列到核酸库中的一种查询。
4.TBLASTN 是蛋白序列到核酸库中的一种查询。与 BLASTX 相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。
5.TBLASTX 是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6 条可能的蛋白序列)。
Specialized BLAST:是一些特殊目的的 Blast,如 Primer-BLAST、IgBLAST。
假设以下为一未知蛋白序列,我们通过 blast 搜索来获取一些这个序列的信息。
点击选择“BLASTP”,粘贴序列到规定地方。
点击“Algorithm paramerters”设置详细参数:
点击运行后,结果如下图,请注意数据库的名字和说明,如果不合适,请迷途知返哦~
Blast 的结果显示图:颜色比例尺,可以简单的理解为红色的线表示有较好的比对结果。
Blast 结果的描述区域, Max Score:匹配片段越长、 相似性越高则 Score 值越大。
E value 是得到上述 Score 值的概率的大小。E 值越小表示随机情况下得到该 Score 值的可能性越低。
Blast 比对结果的详细版:Expect(E 值)、Identities(一致性)、Gaps(缺失或插入)三项是评价blast 结果的标准。E 值接近零或者为零时,具体上就是*匹配了。一致性:匹配上的碱基 数占总序列长的百分数。
有料,但不难理解
有用,但不难操作
这就是 blast 的魅力所在