作为一款软硬件双重加速的生信分析工具,MegaBOLT提供可视化界面,操作简单便捷,可实现测序与分析的一站式全自动调度,无需人工发起计算任务。以MegaBOLT在WGS/WES生信分析和病原鉴定等方面的表现为例,本期回顾聚焦高通量测序分析的速度、精度和广度。
分析速度:突破10倍-90倍的大幅提速
在Germline胚系变异检测中,MegaBOLT仅需2小时即可完成30X的WGS数据分析,24分钟完成400X的WES数据分析。相对于传统的分析流程,MegaBOLT提速20倍以上。
在Somatic体细胞变异检测中,MegaBOLT仅需5小时即可完成一对肿瘤细胞和正常细胞的WGS测序数据分析(测序深度:40X),42分钟完成一对肿瘤细胞和正常细胞的WES测序数据分析(测序深度:400X)。相对于传统的分析流程,MegaBOLT提速10倍以上。
特别地,针对超高通量测序平台的分析需求,进阶版MegaBOLT——MegaBOLT-Pro仅需1天的时间就能完成高达6Tbp的WGS数据分析,满负载的情况下一年可以完成1.7万人的WGS数据分析。相对于传统的分析流程,MegaBOLT-Pro提速近90倍。
测序精度:超过99%的INDEL和99.9%的SNP
结合谷歌公司开发的一款基于深度学习的变异检测软件DeepVariant,MegaBOLT集成了MegaBOLT-DV算法,在变异分析性能上更为精准。通过对几组不同数据量(20-200Gb)、不同建库方法(PCR/PCR-Free/探针)和不同读长(PE100/PE150)的下机数据进行分析测试,这一结论得到了验证:利用MegaBOLT-DV在SNP和INDEL的变异检测性能方面具有显著性优势。
此外,将PCR-free技术与MegaBOLT-DV相结合,15X WGS的数据分析可以达到SNP超过99.9%、INDEL超过99%的超高检测精度,即在理论上达到了常规PCR建库方法下30X WGS的分析效果,有助于节约测序成本。
应用广度:以病原快速鉴定系统为例
除了WGS/WES分析,MegaBOLT还可以集成多个特定领域应用分析系统,适用于遗传病基因数据分析、肿瘤检测及用药研究和病原微生物宏基因组分析等。以病原快速鉴定系统为例,集成该系统的MegaBOLT能快速、准确、全面地对原始样本中的微生物进行分类鉴定,并且自动出具分析结果,为感染性疾病的诊疗提供参考。
首先,在MegaBOLT内置的病原快速鉴定系统中,收录超过2万种微生物做病原数据库以及10余种常见动物参考基因组作为宿主数据库。特别地,在该病原数据库已添加新型冠状病毒序列,可用于新冠病毒的快速鉴定。
其次,在MegaBOLT中集成的实验室信息管理系统ZLIMS,为病原快速鉴定系统提供了一键生成网页报告的功能,其中包括数据质控、六大分类物种鉴定统计、毒力因子和耐药因子鉴定。
最后,利用MegaBOLT及其病原快速鉴定系统已在多次疫情防控工作中发挥了重要作用。以某养殖基地的多只青山羊发生不明病原的感染为例,其主要症状为口唇出现脓包并结痂。该养殖基地将几只病情较严重青山羊样本的测序数据采用MegaBOLT(华大智造病原微生物产品组合的核心产品之一)进行分析和组装,分析结果表明:在送检的DNA样本中有64.2%、RNA样本有44%,均检测出Orf病毒;利用鉴定出的reads能够组装出Orf病毒基因组,然后将reads与组装好的基因组进行比对,比对率达到86.7%,平均覆盖率为87.6%,平均测序深度为200X。
要点回顾
如有任何相关问题,可以发送邮件至: