DNA基因测序技术从上世纪70年代起,历经三代技术后,目前已发展成为一项相对成熟的生物产业。测序技术的应用也扩展到了生物、医学、制药、健康、农林、园艺、花卉、环保、法医等许多领域,并成为一项与我们衣食住行密切相关的高技术产业。据最新统计,2012年全球基因测序市场的产值已超过百亿,按最近几年增长速度,预计2017年市场产值将加倍。在测序产业占世界市场份额第一的正是总部设在深圳的我国华大基因研究院。因此可以说,基因测序在我国生物科技领域具有非常重要的战略意义。
“第三代测序技术”的研发已有近十年时间,商业化的第三代测序仪上市也有三年。但目前测序市场仍为二代测序技术所垄断(我国顶级科研机构和商业公司所拥有的三代测序仪可能仅有数十台)。三代测序技术产生的读段更长,测序成本更低,其取代二代技术是测序技术发展的必然趋势。然而由于三代测序技术错误率高,现有的组装软件多是对第二代测序数据组装软件的“修补”而并没有充分考虑到三代测序技术的数据特征。事实上,基因组装算法问题被广泛认为是计算生物学和生物信息学领域最复杂的计算难题之一,也是目前阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍。
最近,美国马里兰大学 Chengxi Ye, James A. Yorke, Aleksey Zimin 等与中国科学院昆明动物研究所遗传资源与进化国家重点实验室马占山研究员在这一领域的合作研发取得新突破。该研究团队在一篇题为DBG2OLC: Efficient Assembly of Large Genomes Using the Compressed Overlap Graph 的文章中引入了一种新的针对三代测序技术的基因组装算法,并开发出一款软件(DBG2OLC)。另外作者(Ye et al. 2011, 2012)于2011年发布的SparseAssembler曾经比当时主流的基因组装软件节省90%的内存空间,而其计算时间和组装质量却毫不逊色。著名的SOAPdenovo的升级版,也是目前最广泛应用的基因组装软件SOAPdenovo2即采用了SparseAssembler算法。
多组测序数据的测试表明:与目前用于三代测序最优秀的一些基因组装软件(例如PacBio2CA, HGAP, ECTools)相比,DBG2OLC在计算时间和内存空间的消耗通常仅为其它算法的1/10。理论上,DBG2OLC在时间和空间的使用上相对其它同类软件可减少达1000倍。例如组装关键步骤之一的“两两比对”计算,采用一组由 PacBio提供的人类基因组数据,DBG2OLC 使用一台普通PC仅用了6小时完成。而同样计算,Pacific Biosciences所报道的时间为 405000 CPU小时,而且是在Google的计算集群上完成。因此,DBG2OLC 算法基本解决了目前三代测序技术所面临的计算技术挑战,从而为推进基因测序技术的产业升级奠定了良好的技术基础。
[来源:生物探索]
2024.06.26
363项!市场监管总局印发2024年国家计量技术规范制修订计划
2024.06.14
数亿元D+轮融资!微远基因将建分子诊断试剂仪器基地,持续发力病原精准诊断赛道
2024.06.06
版权与免责声明:
① 凡本网注明"来源:仪器信息网"的所有作品,版权均属于仪器信息网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:仪器信息网"。违者本网将追究相关法律责任。
② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。
③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认仪器信息网有权转载。
谢谢您的赞赏,您的鼓励是我前进的动力~
打赏失败了~
评论成功+4积分
评论成功,积分获取达到限制
投票成功~
投票失败了~