图1. 华大智造发布MGIEasy stLFR文库制备试剂盒
2018年10月25日,第十三届国际基因组学大会(简称“ICG-13”)在深圳隆重召开。华大智造同期举行“基因组学技术与应用研讨会”,并在会上发布MGIEasy stLFR文库制备试剂盒。MGIEasy stLFR文库构建试剂盒是世界范围内首款基于无分隔共标记方法的长片段读取试剂盒,该试剂盒利用高精度短读序列获得长距离信息,融汇二代三代测序技术之长,被誉为“完美的WGS建库”。
该技术于2018年3月在国际人类基因组大会(Human Genome Meeting,简称HGM)正式发布,今年10月成功转化为试剂盒产品并发布。基于华大智造专利的DNA分子共标签技术,即将来源于同一DNA长片段的短读测序片段标记上相同分子标签,stLFR实现了基于高精度短读测序获取长片段DNA信息 (图2)。与华大智造世界领先的DNBseq?测序技术相结合,stLFR技术能够实现高质量变异检测,二倍体基因组定相,结构变异解析及其他长读长应用。
为了让用户第一时间体验该技术,华大智造招募首批试用客户(可扫描文末二维码申请)。相比传统WGS文库和其他同类产品,stLFR文库仅需1 ng DNA且无需预扩增即可获得高质量的全基因组测序文库;二倍体定相区块N50值可达10 Mb,有效检出倒位、异位、删除等结构变异;单管无分隔反应,无需微量移液设备或复杂微流控系统;全部反应在磁珠上完成,易于高通量自动化建库。
图2. stLFR技术原理示意图。该技术从提取好的长片段DNA起始,将转座子序列随机插入至长片段DNA中,利用DNA双链互补原理将该产物与带有多拷贝分子标签的磁珠载体结合,在引入第二个接头后进行PCR扩增,最终完成文库构建。
stLFR -数据表现
长片段读取
利用DNA共标记方法,MGIEasy stLFR试剂盒可以检测分析DNA分子长度平均长度可达50-70 Kb,最大值可超过300 kb(图3A)注1。不仅如此,得益于stLFR文库超高的分子标签数,超过85%的标签内有且仅有一个DNA长分子(图3B)注2,这赋予了stLFR文库一些可以媲美单分子测序的数据特性。
注1:该数据表现决定于初始DNA提取长度。
注2:该数据表现决定于初始DNA投入量和DNA提取长度。
图3. stLFR 长片段读取特征。(A)片段长度分布。stLFR文库可以检测的DNA分子长度典型值一般为50 Kb左右,最长可达300 Kb。(B)每个标签内的长片段数量分布。从1 ng DNA起始构建stLFR文库时,约有85% 标签内有且仅有一个DNA长分子。
覆盖均匀性
从1 ng DNA起始,stLFR文库即可获得与使用100 ng DNA起始的常规全基因组测序文库相当的基因组覆盖均匀性表现(图4)。
图4. stLFR 文库测序深度均匀性。蓝色实线为stLFR文库,绿色虚线为100 ng起始的常规全基因组测序文库,灰色虚线为理论预期深度分布(泊松分布),数据已均一化至30X覆盖度。
SNP & InDel检测
30X深度下,stLFR文库SNP检测阳性预测值(Positive predictive value, PPV)与灵敏度(Sensitivity)均可达到0.99以上,InDel检测F值(F-measure)可达0.95,整体变异检测表现达到相同深度的常规全基因组测序文库表现的最佳水平(图5)。
图5. stLFR 文库30X覆盖度变异检测能力评估。将stLFR检测NA12878样本的变异结果与Genome in a bottle(GIAB)提供的高置信区间检测结果进行比较,计算阳性预测值与灵敏度。
二倍体定相
利用共标签短读序列,stLFR可以轻松获得二倍体基因组上杂合位点定相信息,定相区块N50值可达10 Mb以上(图6)注3,可有效解析基因调控和编码区变异组合。
注3: 该数据表现共同决定于初始DNA长度和测序深度。
图6. stLFR 定相区块在染色体上的分布情况。在40X深度下,stLFR文库数据定相区块N50值可达34 Mb,杂合位点定相比例高达99.7%
利用分子标签和长片段信息,stLFR可以对多种结构变异进行准确检测。图7展示了stLFR对NA12878中已知的SV进行检测,检出率达到100%。图8展示了利用stLFR文库分别对携带5号染色体和12号染色体平衡易位病人样本(图8A)和已知2号染色体染色体内倒位的GM20759细胞系样本(图8B)进行检测的结果。
图7. 对NA12878中已知的SV进行检测,检出率能达到100%
图8. stLFR 文库结构变异结果展示。(A)携带5号染色体和12号染色体平衡易位病人样本的stLFR检测的分子标签重叠热度分布图。(B)已知2号染色体染色体内发生倒位的GM20759细胞系样本分子标签重叠热度分布图。
stLFR变异检测能力总结
古语有云,十年磨一剑。华大智造已经投入了五年时间进行stLFR技术的研发,并且会继续对该技术进行优化升级。更多基于stLFR的技术,如二倍体从头组装等,也将陆续面世。希望在不远的将来,可以通过stLFR技术最终实现完美基因组测序。
什么是完美基因组?怎么获得完美基因组?请持续关注MGI华大智造公众号,稍后为您揭晓。
扫描下方二维码,申请测试stLFR文库制备试剂盒