上海沪宇生物科技有限公司
2013/9/5 8:11:06
单分子实时测序技术(SMRT)因其出色的读长而引人注目。然而,因通量较低,且一直被错误率高的流言所困扰,SMRT技术似乎有些被忽视。近日,几位科学家在《Genome Biology》杂志上发表文章,试图消除这些误解,为SMRT正名。
这篇文章的通讯作者是New England Biolabs公司的科学家Richard J.Roberts博士。他也是1993年诺贝尔医学奖获得者。另外两名作者分别来自Broad研究院和冷泉港实验室。
作者认为,当今的新一代测序技术有一些明显的限制,特别是读长短和扩增偏向,这限制了我们对完整基因组测序的能力。同时,随着新一代测序技术的兴起,人们的重点似乎也不放在新发现的基因有何功能,而那些功能如何让生物体工作,但这正是我们测序的首要原因。
然而,SMRT这项新技术不仅能从单个未扩增的分子中产生更长且高度准确的DNA序列,还能显示甲基化的碱基存在于何处,从而提供了有关DNA甲基化酶的功能信息。如今,PacBio RS II的平均读长达5,000 bp,zui长读长超过20,000 bp,通量也较之前的版本增加一倍。
作者在文中提到,SMRT技术具有三大优势。首先,长的读长特别适合新颖基因组的de novo组装。尽管新一代测序能够提供基因组的深度覆盖,但短的读长和扩增偏向会导致片段化的组装,特别是在遇到复杂重复或扩增不佳的区域时。利用SMRT测序运行的长reads,它将覆盖更多重复和缺失的碱基,从而自动消除缺口,节省整理时间。目前细菌基因组正利用这种方法*组装,他们希望这种做法在不久的将来会转化到更大的基因组。
其次,考虑到DNA甲基化酶。这些作为单独的实体或限制-修饰系统的一部分而存在。在这两种情况下,DNA甲基化酶对相对短的序列motif进行甲基化,因DNA聚合酶的动力学有所改变,从而很容易从SMRT序列数据中识别。此外,SMRT测序也能识别RNA碱基修饰,不过要用RNA转录酶取代DNA聚合酶。因此,通过这种测序方法可直接获取功能信息。
第三就是关于SMRT测序不如其他NGS平台准确的流言。研究结果已表明,SMRT测序与其他测序技术在确定遗传多态性上的性能相当。同时,利用SMRT测序及其他技术来组装完整基因组被证明与传统方法同样可靠且准确。此外,也有人证明,只利用SMRT测序reads进行组装实现了与其他平台相当甚至更好的性能。作者也进一步谈了平台错误率。他们认为,SMRT测序数据的优势在于其读长长和错误的随机性。单个reads确实包含较多的错误:大约11%-14%,或Q12-Q15,而Illumina为Q30-Q35。然而,考虑到足够的深度(比方说8x或更高),SMRT测序提供了高度准确的基因组序列,因为同一错误不可能被观察到很多次。
作者总结道,将其他技术的序列密集数据与中度覆盖的SMRT数据相结合,可改善基因组,获得它们的甲基化模式,并推导出甲基化转移酶基因的功能活性。作者呼吁从事细菌基因组研究的所有小组采用这一策略。此外,随着PacBio RS II仪器的推出,作者认为SMRT测序有望更广泛地应用于真核基因组的组装。