随着高通量测序技术的发展,宏基因组学已成为研究微生物群落物种及功能的主流方法学,广泛应用于肠道微生物、环境微生物等研究领域。近日,法国国家农业食品与环境研究院(INRAE)基于华大智造DNBSEQ-T7、MGISEQ-2000* 等7款主流测序平台对高度复杂的微生物群落样本进行了测试,相关研究成果发表于Nature子刊Scientific Data。该项研究基于不同测序平台构建了统一的微生物宏基因组测序基准化分析数据库,为相关研究者提供了全面而真实的测序平台选择参考依据。
其中,华大智造DNBSEQ-T7以其超高的数据产量和优异的准确性获得了研究人员的高度认可。文章通讯作者Almeida在接受Genomeweb采访时表示,“我们对DNBSEQ-T7的出色表现感到非常地惊喜。与其他技术平台相比,T7以极低的错误率平稳地在每一轮的运行中完成超高深度的测序,这次测试可以证明:在宏基因组测序应用中,从成本可控的角度来看,T7是非常实用的技术平台之一!”
样本类型:研究共使用91种不同的菌株,覆盖29个细菌门和古生菌门,通过混合单个菌种的gDNA,构建了3个微生物群落模拟样本,分别命名为MOCK1(71株)、MOCK2(64株)和MOCK3(87株)。建库方案:在DNBSEQ平台的测序文库采用了华大智造MGIEasy 通用DNA文库制备试剂套装;在其它平台的文库均采用各自配套的建库试剂盒进行制备。
测序平台:包括华大智造DNBSEQ-T7(PE100)和MGISEQ-2000*(PE100)在内的七款测序平台。
数据分析:分析流程包括下机数据质控、比对分析、子采样分析、宏基因组组装和组装质量评估,各厂商平台所使用的分析软件不尽相同,如表1所示。
表1 各平台所使用的数据分析软件
为评估测序深度对微生物基因组丰度分析的影响,研究者将3个样本的微生物基因组丰度在不同测序深度下的实测值与理论值进行比较。总体而言,当测序深度Mapped Reads数达到100K时,所有平台Spearman相关性都比较理想,相关性系数可达0.9以上。其中,MOCK1样本结果表明, DNBSEQ-T7和MGISEQ-2000*的相关性是最佳的,与此同时,在MOCK2样本测试中DNBSEQ平台的相关性同样表现优异。
图1 不同平台对3份模拟样本的基因组丰度实测值与理论值的相关性分析结果图
研究者针对MOCK1样本包含的所有菌株的基因组丰度实测值与理论值进行了差异分析,结果表明,各测序平台的大多数菌株分析结果是准确的,同时发现大多数物种的基因组丰度与测序平台、读长、分类分析法、GC含量、基因组的大小以及完整性并没有相关性,即使在500K Reads的低深度情况下也是如此。值得一提的是,DNBSEQ-T7平台对大多数菌株基因组丰度的实测值与理论值非常接近。
图2 MOCK1各菌种丰度的实测值与理论值的差异分析图
华大智造基因测序仪DNBSEQ-T7在微生物群落宏基因组研究中数据表现优异,性能稳定,准确度高,同时依托超高通量的平台优势,可满足复杂微生物群落的物种和功能基因的识别,持续助力微生物群落的结构和多样性研究发展。
【注:MGISEQ-2000已在海外部分国家和地区更名为DNBSEQ-G400】