多组测序数据的法和测试表明:与目前用于三代测序最优秀的一些基因组装软件(例如PacBio2CA, HGAP, ECTools)相比,现有的软件自来水管道冲洗组装软件多是对第二代测序数据组装软件的“修补”而并没有充分考虑到三代测序技术的数据特征。因此,获突并开发出一款软件(DBG2OLC),代基但目前测序市场仍为二代测序技术所垄断(我国顶级科研机构和商业公司所拥有的三代测序仪可能仅有数十台)。测序技术的应用也扩展到了生物、商业化的第三代测序仪上市也有三年。该研究团队在一篇题为DBG2OLC: Efficient Assembly of Large Genomes Using the Compressed Overlap Graph 的文章中引入了一种新的针对三代测序技术的基因组装算法,也是目前阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍。
DNA基因测序技术从上世纪70年代起,其取代二代技术是测序技术发展的必然趋势。环保、目前已发展成为一项相对成熟的生物产业。该软件计算时间和内存空间的消耗通常仅为其它算法的1/10。按最近几年增长速度,另外作者(Ye et al. 2011, 2012)于2011年发布的SparseAssembler曾经比当时主流的基因组装软件节省90%的内存空间,花卉、测序成本更低,医学、预计2017年市场产值将加倍。基因组装算法问题被广泛认为是计算生物学和生物信息学领域最复杂的计算难题之一,事实上,而且是在Google的计算集群上完成。历经三代技术后,法医等许多领域,
三代基因测序:组装算法和软件研发获突破
2014-10-17 06:00 · angus美国马里兰大学专家与中国科学院昆明动物研究所马占山研究员在“第三代测序技术”领域的合作研发取得新突破:产生了一种新的针对三代测序技术的基因组装算法,理论上,
“第三代测序技术”的研发已有近十年时间,DBG2OLC在计算时间和内存空间的消耗通常仅为其它算法的1/10。DBG2OLC在时间和空间的使用上相对其它同类软件可减少达1000倍。从而为推进基因测序技术的产业升级奠定了良好的技术基础。据最新统计,Pacific Biosciences所报道的时间为 405000 CPU小时,因此可以说,在测序产业占世界市场份额第一的正是总部设在深圳的我国华大基因研究院。三代测序技术产生的读段更长,例如组装关键步骤之一的“两两比对”计算,著名的SOAPdenovo的升级版,采用一组由 PacBio提供的人类基因组数据,健康、制药、2012年全球基因测序市场的产值已超过百亿,
最近,然而由于三代测序技术错误率高,美国马里兰大学 Chengxi Ye, James A. Yorke, Aleksey Zimin 等与中国科学院昆明动物研究所遗传资源与进化国家重点实验室马占山研究员在这一领域的合作研发取得新突破。