太阳集团2018网站(绿色应用商店)-最新App Store

公 司 动 态COMPANY DYNAMIC

太阳集团2018网站·优势介绍 | PB-HiFi模式,细菌完成图新策略!

来源:admin    发布时间:2022-11-16   阅读数:443


“细菌作为地球上最古老的生物之一,至少在大约18亿年前就已在地球上广泛传播。它们无处不在且数量惊人。 从严寒极地到酷热赤道,从巍峨山顶到幽深海底,从动植物到森林土壤,都可以找到它们。每种细菌都适合生活在特定的环境环境中。但是,由于我们看不到它们并且对它们的了解相对较少,因此细菌的世界对我们来说是神秘的。客观全面认识细菌,是我们正确利用它们的第一步。”



HIFI技术的产生

从1995年第一个物种流感嗜血杆菌完成图到现在,细菌基因组完成图走过了将近30多个年头。在此期间,测序技术也在不断的发展,从原来高成本的sanger测序到后来的短读长的illumina测序,再到最近出现的第三代ONT测序技术,对于拼接细菌完成图的效果仍不尽如人意。因此寻找一种高通量、长读长、高准确率的测序技术是广大研究人员的目标,而HiFi测序技术以其长读长(长度可达25 kb)、高准确率(≥Q30,即超过99.9%的测序精度)、单分子分辨率、高灵敏度、无GC偏好性等优势,在微生物研究中表现出极大的应用优势。



什么是HIFI测序?

HiFi reads是基于Sequel II平台推出的CCS(Circular Consensus Sequencing)测序模式产生的兼具长读长和高准确度的测序序列。该测序模式下的酶读长远大于插入片段长度,测序时,聚合酶会绕着DNA模板进行环形比对测序,使得插入片段被多次测序,经过一致性校正,最终得到高准确度的HiFi reads,用于基因组组装。



HIFI测序的优势

1

单碱基分辨率高

PacBio测序基于边合成边测序的原理。实时记录荧光信号,转化为单碱基信息,获得具有单碱基分辨率的高精度序列。


PacBio测序:单碱基分辨率



而ONT则是基于电信号原理,一次产生的信号包含4-5个碱基, 需要对信号进行碱基解码,而在解码过程中容易受到噪音信号和随机数据的影响,从而出现delete和insert的错误,降低了ONT技术的单碱基分辨率。



Nanopore单信号包含4-5个碱基



2

序列准确度高

我们知道PacBio在测序过程中会发生随机错误,所谓随机错误,其产生错误的位置不会总发生在同一个地方,而CCS模式可通过自身纠错获得准确率高达99%的序列。而ONT技术的测序错误率高达10-12%,且其发生的则是系统错误,产生错误的位置总是在同样的区域,如果发生错误的区域恰好二代测序无法覆盖到,那么我们就难以利用二代数据进行校正,那么错误会一直残留到最终的序列结果中, 从而导致难以区分序列错误和真实突变。



3

测序错误无GC偏好

PacBio在测序错误上没有明显的偏好性,即使在高低GC区域,也能实现均匀覆盖。而ONT技术在测序错误上则存在明显的偏好性。在高GC含量区域、同聚物区域和串联重复区域错误率大大增加。导致ONT数据在这些地方检测到的结构变异可信度较低。



PacBio无明显错误偏好性




ONT的测序错误在高GC区域显著增加



4

组装周期短

用于组装的HiFi reads是经过纠错的一致性序列,组装时不需要再进行纠错,而ONT数据因其序列错误率较高,在进行细菌完成图的组装过程中,一般会选取二代数据对其进行纠错和校正,因此利用HIFI技术进行细菌完成图的组装周期明显短于ONT+Illumina的组装周期。



说了这么多,咱们总结一下HIFI技术与ONT技术的优缺点。HIFI技术兼具了长读长,高准确率的特点,而ONT技术虽然准确率欠缺,但是在读长方面会比HIFI技术略胜一筹,至于该用哪种方式进行测序,老师可以根据自己的需求进行选择!



分享到: