的测序仪—包括ABI的Ion Torrent PGM和Illumina的Miseq—使得普通的实验室也有能力进行下一代测序。而Pacific Biosciences因为解读了肆虐海地的病原体Vibrio cholerae的基因组而备受瞩目。[1]同时,在临床上人类基因组以近乎枯燥的规律而被阐明。正如Erika Check Hayden在《Nature》杂志上所报告,人类基因组测序中心的Richard Gibbs估计“在今年(2011年)有5,000人的基因组完成测序,明年预计为30,000人。”
“今年,基因组测序从名人测序转向了临床研究,”专攻基因组学的英国博士后Daniel MacArthur说道。去年,摇滚歌手Ozzy Osbourne对他的基因组进行了测序。今年(2011年),Gibbs和同事们报告称,由一对14岁的患有多巴反应性肌张力障碍的异卵双胞胎全基因组测序结果鉴定出了这种疾病的分子病因, 从而改进了治疗策略。[3]一位患有无从解释的肠道疾病的小孩让报道其感人故事的《密尔瓦基新闻卫报》(Milwaukee Journal Sentinel)获得了普利策奖。这名小孩患有的医学罕见的遗传畸变,该疾病后通过外显子测序得到了解答,这是一场花费了75,000美元。在Walter Isaacson撰写的苹果创始人Steve Jobs传记中,我们知道Jobs在自己被诊断患有胰腺癌后,他对自己的癌症基因组进行了“部分测序”,试图找出一种进行“靶向治疗”的方法。[5]
通量提高,成本降低
Isaacson 写道,Jobs的测序花费了大约100,000美金。自那之后,测序价格陡降了两个数量级。在(2011年)二月份,Kevin Davies在《Bio-IT World》报道中称全基因组测序服务商Complete Genomics Inc.(以下简称CGI)的测序价格为每人9,500美元,8个基因组起测。[6]据CGI的CEO Clifford Reid称,该公司现在的报价是每个基因组4,000美元,一个月可完成750个基因组,到2012年初可实现每月1,000个。
以一个月完成750多个基因组的速度计算,CGI一年可以完成大约10,000个人类基因组测序。不过,Reid说得益于更多摄像机和DNA芯片的更利用,CGI将要配备的一种新仪器将使公司的产能提高到每年100,000个基因组。而超越性的下一代升级—有了更好的光学技术及更高密度的样品空间的支持—将使上面说的数字提高到另一个数量级,到2015年实现每年测出1百万个基因组,Reid说道。
更长的序列读长可以做到线性拼接
同时,CGI公司正在开发一种新的技术LFR(long-fragment reads 长片段序列),通过此技术可以使公司依靠生物信息学工具将测得的序列通过拼接,达到100,000个碱基长度的片段。Reid说,以此长度序列,公司可以解决遗传学上的“潜藏问题”,即将不同的DNA链进行区分。
当然,人类是双倍体,携带了两套染色体。目前的问题是,如果一个个体在一个基因上出现两个突变,那这两个突变是位于其中一个染色体拷贝上,还是两个拷贝上各有一个错误? “医生当然必须知道这些信息以便做出正确的诊断,”Reid说。他解释说,现有的技术无法做到,因为这些技术使基因组发生了重新装配,使得无法将一个特定的突变定位到某个特定染色体。在这类系统中,“相位”(phase)信息—就是说基因组片段之间物理上互相连接的位置信息—丢失了。
CGI使用的是基于化学连接技术的短序列测序技术,每次大约测70个碱基。不过通过将片段标上标签,依片段的不同分子来源而进行标记,LFR技术则可以规避该问题。Reid补充说,LFR的另一个好处是能将公司的测序精度从10-5提高到10-7,或者说从每个二倍体基因组上60,000个错误降低到600个。
据公司的一位发言人透露,CGI在2011年底进行LFR服务试点,正式启动定于2012年。“我预计,这会是一笔大生意,”CGI科学顾问委员会成员、哈佛医学院遗传学家George Church如是说。
个人化NGS系统
Illumina公司
在NGS领域,其他一些新技术的发展,使一些不是从事人类全基因组研究的人员获益匪浅。例如,Illumina推出的MiSeq,这是一种新的测序设备,可在不必要使用该公司的HiSeq测序仪的时候使用。
“很多的应用只需要测到数百万或者数十亿个碱基,”Illumina公司的信息产品市场副总监Jordan Stockton说,例如那些对细菌基因组的测序,或特定人类等位基因的靶向重测。
MiSeq采用了与HiSeq相同的边合成边测序的方法,这就意味着研究人员可以在MiSeq与HiSeq之间实现无缝切换,而无需再去学习的操作手册。售价125,000美元的MiSeq平台可在一次运行中产生小于2G的数据量,双端读长可以达到150bp,the Broad Institute显示MiSeq单端测序可以达到300bp,MacArthur说,这也就是说双端测序就可能达到500bp,因为中间会包含一些重叠区,“这让人印象非常深刻,”(HiSeq目前大能实现125bp的双端读长,主要是因为两种设备在循环次数上存在差异。)
据Stockton的说法,Illumina近还宣称开发了三种新的用于NGS的工具。一种是TrueSeq Amplicon Kit,可同时针对96个样品实现每个样品384个目标的测序。第二种是简化的文库制备试剂盒,可以将“一天或两天”的操作简化至90分钟。后一种是BaseSpace,该公司推出的云端生物信息学系统。
Stockton说,BaseSpace由5个工作流组成:细菌全基因组测序、靶向测序、宏基因组学、小RNA表达谱以及文库质量控制(为那些想在测序前进行文库质量验证的人)。不过“这种云技术的真正美妙之处就是,它非常易于为使用者增加新的功能”,他说道。事实上,Illumina计划推出BaseSpace的“应用商店”,这样用户可以将新的算法加入到自己的数据分析流程中。
Life Technologies公司
Life Technologies公司去年(2010年)凭借其每台50,000美元的Ion Torrent PGM进入低价台式个人测序仪市场。该设备本质上是将半导体芯片转换成了超高密度pH计。推出之时,PGM采用称为“314”的芯片,在两个小时内可产生1,000万个碱基,每个读长为100个碱基,花费500美元。后来改用“316”芯片,产能提高了10倍。目前试用用户可用到的“318”芯片又提高了输出能力,一次运行可产生10亿碱基的数据。
Life Technologies的半导体测序芯片
ABI公司副总裁Mark Gardner解释说,一次运行产生10亿碱基数据得益于两个方面,一是芯片上传感器数量增加,314上传感器数为140万,现在是1130万,可产生至少500万个读长;二是读长增大,现在增长到了200碱基。Gardner说,到2012年某个时候,读长将增加到400碱基,意味着318芯片理论上每次运行可以产出20亿碱基的数据,而价格仍是500美元。他说:“在美国人类遗传学协会年会上,我们展示了525个碱基对的读长。”
Gardner说,Life Technologies的5500系列遗传分析系统也预计在2012年进行升级。彼时,该系统将可运行Wildfire chemistry,将在实验台上进行的模板制备(包括费时费钱的乳剂PCR步骤)工作转到了仪器中进行。这降低了样品制备的费用,提高了读取密度及一致性,Gardner说。通过使点样更为紧凑并从头尾双向同时进行读取,Wildfire将成像特征数量提到了5倍。Gardner说这就足够“在一次运行中完成10个基因组。”(目前5500x1系列遗传分析系统每个运行产生大约2个人类基因组的数据量。)
454 Life Sciences
Roche Life Sciences的454 Life Sciences也升级了它的测序平台。454 GS FLX+结合该公司的新的GS FLX Titanium Sequencing Kit XL+升级到GS FLX,将其读长提高到了每个运行1000个碱基。“利用该系统可以获取高质量、高通量、与Sanger测序法相似长度的测序结果。”市场Mike Catalano说道,并且补充说到每运行一次可以产生700M的数据。454还为靶向测序提供了引物试剂盒,包括人类HLA区域扩增及白血病相关基因分析试剂盒(2012年推出)。
第三代测序
过去的一年还见证了称为第三代测序技术的成果。其中的一件就是Pacific Bioscience的PacBio PR的正式推出。该平台采用单分子荧光测序技术,在解决海底霍乱流行及德国 E. coli 爆发中发挥了重大作用。
据Pacific Biosciences的CTO Stephen Turner称,PacBio RS的读长平均为2,500-3,000碱基,某些还长达22,000碱基,这使得该设备尽管与竞争技术相比每读长的精度要低(85%-89%的精度),但特别适于解决基因组结构问题。
Tuiner说,PacBio初是专注于一些小的常规应用,包括细菌的从头测序、病原体测序、病毒测序及目标基因测序。不过,该技术*性地实现了一些新应用,包括基于如5-甲基胞嘧啶及5-羟甲基胞嘧啶对用于读取序列的聚合酶动力学影响而直接鉴定此类DNA修饰。
“这些化学修饰就像是高速路上的减速带,当聚合酶对其进行驱动时,使得DNA的延伸变慢,或者有时候会变快,这取决于特定环境。那些模式产生特异信号从而可以检测到它们。”Turner说。
纳米孔技术
Oxford Nanopore公司正在开发两种纳米孔测序方法(“链条法”及“核酸外切酶法”,并已就后者同Illumina达成了商业化协议),公司拒绝评论其项目的进展状态,但一些在线信息显示此系统由一系列的可以相互通讯的测序节点形成一个网络结构,每个节点配置一个耗材仓库。每个GridION节点可独立运行,或通过网络与其他节点通讯达到更大的测序效果,该架构可实现多功能工作流。
不过,该公司在2011年10月20号公开的职位招聘列表包含一个“试用合作,DNA测序”职位,职责包括“管理与的基因组研究机构中的重点客户进行的技术开发合作”,Oxford在不久的将来可能会褪去其神秘外纱并启动试用程序。
另一个专注于纳米孔的公司Genia也迈出了它们商业化的*步。据该公司CEO Stefan Roever称,Genia正在开发一种使用生物孔和集成电路(相同的技术正驱动着计算机工业发展)的纳米系统。Roever解释说,该系统“运用的电子学,并将其应用到信号处理过程中非常棘手的问题,”也就是说,对单个DNA碱基通过纳米孔时产生的微弱的电子顺序信号进行捕捉。
Roever说,Genia的系统的核心是活性芯片,能够对各个孔进行独立读取和控制。[8]芯片“通电”之后,研究人员可以对纳米孔阵列进行动态组装,向纳米孔中添加DNA样并实施测序,同时可以依需要将这些DNA分子排出纳米孔。尽管实验表明其可以区分四种碱基并控制DNA的运动,但该技术目前还处在研发中,Roever说道。“我们希望2012年*季度能够推出带有几百个传感器的这种芯片的α版本。”
这种芯片如何与Oxford及其他的测序界大牛过招还需拭目以待。不过当下还有一位大牛没有参与到竞争中来,那就是第三代单分子测序公司Helicos BioSciences。据GenomeWeb Daily News报道,Helicos在11月14号宣称2011年第三季度的收入增长,“但要小心因为缺乏现金注入而不得不在年底关门大吉。