基因测序行业发展迅速,三代核酸测序方法技术相继出现。测序技术的每一次发展,对生命科学的研究产生十分重要的意义。在这里主要对当下主流测序技术的原理及特点进行了重点解析。
从科研领域的全基因组测序(WGS)到临床应用的无创产前基因检测以及高血压个体化治疗检测,基因的作用和重要性日益凸显,正在不经意间以其巨大的力量改变着人们的生活,使人类对自然和自身的认知进入到了一个新的层面。同时,个体化医疗概念的兴起,激发了人们对基因测序的需求,也使得基因测序商业化、大众化的意愿成为了科研界和临床应用界的共识。那么基因测序技术经历了一个怎样的发展过程呢?每个阶段有什么特点呢?
一、第一代测序技术
早在1954年,Whitfeld等就提出了测定多聚核糖核苷酸链的降解法,该方法利用磷酸单酯酶的脱磷酸作用和高碘酸盐的氧化作用从链末端逐一分离寡核糖核苷酸并测定其种类。但由于操作复杂等原因,该方法并没有被广泛应用。
在1977年,Sanger等提出了经典的双脱氧核苷酸末端终止测序法,标志着第一代测序技术的诞生。同一年,Gilbert等提出了化学降解法。该方法与Sanger法类似,都是先得到随机长度的DNA链,再通过电泳方法读出序列。二者的不同之处在于,Gilbert法是先用特定的化学试剂标记碱基再用化学方法打断待测序列,而Sanger法是通过ddNTP随机中断合成待测序列。
此后,在Sanger法的基础上,80年代中期出现了以荧光标记代替放射性同位素标记、以荧光信号接收器和计算机信号分析系统代替放射性自显影的自动测序仪。另外,90年代中期出现的毛细管电泳技术使得测序的通量大为提高。
Sanger双脱氧末端终止测序法的原理是:由于ddNTP的2´和3´都不含羟基,在DNA合成反应中不能形成磷酸二酯键,因此可以被用来中断DNA合成反应。在4个DNA合成反应体系中分别加入一定比例的带有放射性同位素标记的某种ddNTP,通过凝胶电泳和放射自显影后,可以根据电泳带的位置确定待测分子的DNA序列,具体步骤如下图。
第一代测序现在主要用于小规模的测序,如基因的克隆测序等,每个反应大约可读800-1000bp,花费约为0.8-1元。其送样方式可以是经过纯化后的PCR产物、提取的质粒,也可以是转化挑取的菌液(测序公司自己扩大培养并提取质粒)。
二、第二代测序技术
第二代测序技术,即高通量测序,又名下一代测序(Next Generation Sequencing, NGS)。以Roche公司的454技术、Illumina公司的Solexa技术和ABI公司的SOLID技术为标志。
454公司首选将焦磷酸测序应用在测序技术上,之后便被罗氏诊断收购,形成了目前的Roche 454。待测DNA样品被打断成300-800bp的片段后,3' 和5'端分别加上接头,这些接头会使DNA片段结合到微珠上。测序PCR反应就发生在固相的微珠上,并且整个PCR反应和相关的酶被油包水的液滴包裹,每个油滴系统只包含1个DNA模板。扩增后,每个DNA分子可以得到富集,每个微珠只能形成一个克隆集落。454测序仪的测序通道体积非常狭小,只能容纳一个微珠。测序过程中,GS FLX系统会将引物上dNTP的聚合与荧光信号释放偶联起来。通过检测荧光信号,就可以达到DNA测序的目的。相对于Sanger测序,Solexa和Solid测序而言,454可以提供中等的读长和适中的价格,适合从头(de novo)测序、转录组测序、宏基因组研究等。
Solexa的测序原理是可逆终止化学反应。DNA片段加上接头之后,可以随机的附着于玻璃表面(Flow cell),并且在固相的表面经过桥式扩增。这样就形成了数千份相同的单分子簇,被用做测序模板。测序采取边合成边测序的方法,和模板配对的ddNTP原料被添加上去,不配对的ddNTP原料被洗去,成像系统能够捕捉荧光标记的核苷酸。随着DNA 3'端的阻断剂的去除,下一轮的延伸就可以进行。和焦磷酸测序不同,每次DNA只能延伸一个核苷酸。Solexa的读长在100-150bp之间,适合小RNA鉴定、甲基化和表观遗传学研究。
ABI Solid技术的核心是4种荧光标记寡核苷酸的连接反应测序。测序之前,DNA模板通过乳化PCR扩增,和Roche 454的基本相同,只是Solid的微珠更小,只有1μm。3'端修饰的微珠可以沉淀在玻片上。连接测序所用的底物是8个碱基荧光探针混合物,根据序列的位置,样品DNA就可以被探针标记。DNA连接酶优先连接和模板配对的探针,并引发该位点的荧光信号的产生。Solid的读长只有50-75bp,精确度可达Q40,适于基因组重测序和SNP检测。
相比于第一代Sanger测序技术,第二代高通量测序技术具有如下优势:
- 体外构建DNA文库,随后体外克隆扩增待测DNA片段,这就解决了传统Sanger测序技术中好几个限制平行测序规模的瓶颈问题,比如转化大肠杆菌以及阳性克隆挑选等问题。
- 基于芯片的测序方法能极大地提高平行测序的能力,由于每一个待测DNA片段克隆的直径都不到1um,因此可以在芯片上同时对上亿个待测DNA片段进行测序。
- 因为每一个待测DNA片段克隆都固定在芯片上的固定位置,因此可以一次对芯片上的所有片段进行测序,而只需要使用几微升的酶等反应试剂,这就相当于每一个待测片段只使用了几皮升或几飞升的反应试剂,从而极大降低了测序反应的费用。
但如今第二代测序技术也面临着诸多问题,一定程度上阻止了基因测序的大众化趋势。
- 第二代测序技术测序平台和测序成本仍然十分高昂,仪器普遍高达40-70万美元,而一个全基因组测序至少需要2000-5000美元,同时花费几周的时间;
- 第二代测序技术依赖于基因样品的扩增过程,大量的洗脱过程即增加了成本和样品制备的时间,也容易出现错误累积;
- 第二代测序技术普遍读长为150-400bp,无法满足更高的科研需要;
- 大量的数据拼接工作和光学读取导致的大体量数据,让分析变成了耗时耗力的工作。
现在,第二代测序技术已经处于市场发展的中后期阶段,其不足性将在未来更加明显。罗氏公司也已决定于2016年停止其第二代测序平台454的生产。
三、第三代测序技术
近些年出现的Helicos公司的Heliscope单分子测序仪、Pacific Biosciences公司的SMRT技术和Oxford Nanopore Technologies公司研究的纳米孔单分子技术,被认为是第三代测序技术。与前两代技术相比,他们最大的特点是单分子测序。其中,Heliscope技术和SMRT技术利用荧光信号进行测序,而纳米孔单分子测序技术利用不同碱基产生的电信号进行测序。具体原理如下。
Helicos公司的Heliscope单分子测序仪基于边合成边测序的思想,将待测序列随机打断成小片段并在3'末端加上Poly(A),用末端转移酶在接头末端加上Cy3荧光标记。用小片段与表面带有寡聚Poly(T)的平板杂交。然后,加入DNA聚合酶和Cy5荧光标记的dNTP进行DNA合成反应,每一轮反应加一种dNTP。将未参与合成的dNTP和DNA聚合酶洗脱,检测上一步记录的杂交位置上是否有荧光信号,如果有则说明该位置上结合了所加入的这种dNTP。用化学试剂去掉荧光标记,以便进行下一轮反应。经过不断地重复合成、洗脱、成像、淬灭过程完成测序。Heliscope的读取长度约为30-35 bp,每个循环的数据产出量为21-28 Gb。值得注意的是,在测序完成前,各小片段的测序进度不同。另外,类似于454技术,Heliscope在面对同聚物时也会遇到一些困难。但这个问题并不会十分严重,因为同聚物的合成会导致荧光信号的减弱,可以根 据这一点来推测同聚物的长度。 此外,可以通过二次测序来提高Heliscope的准确度,即在第一次测序完成后,通过变性和洗脱移除3'末端带有Poly(A)的模板链,而第一次合成的链由于5'末端上有固定在平板上的寡聚Poly(T),因而不会被洗脱掉。
Pacific Biosciences公司的SMRT技术基于边合成边测序的思想,以SMRT芯片为测序载体进行测序反应。SMRT芯片是一种带有很多ZMW(zero-mode waveguides)孔的厚度为100 nm的金属片。将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部,进行合成反应。与其他技术不同的是,荧光标记的位置是磷酸基团而不是碱基。当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区并在激光束的激发下发出荧光,根据荧光的种类就可以判定dNTP的种类。此外由于dNTP在荧光信号检测区停留的时间(毫秒级)与它进入和离开的时间(微秒级)相比会很长,所以信号强度会很大。其它未参与合成的dNTP由于没进入荧光型号检测区而不会发出荧光。在下一个dNTP被添加到合成链之前,这个dNTP的磷酸基团会被氟聚合物切割并释放,荧光分子离开荧光信号检测区。
Oxford Nanopore Technologies公司正在研究的纳米孔单分子技术是一种基于电信号测序的技术。他们设计了一种以α-溶血素为材料制作的纳米孔,在孔内共价结合有分子接头环糊精。用核酸外切酶切割ssDNA时,被切下来的单个碱基会落入纳米孔,并和纳米孔内的环糊精相互作用,短暂地影响流过纳米孔的电流强度,这种电流强度的变化幅度就成为每种碱基的特征。碱基在纳米孔内的平均停留时间是毫秒级的,它的解离速率常数与电压有关,180 mV的电压就能够保证在电信号记录后将碱基从纳米孔中清除。
第三代测序技术由于实现单分子测序,极大地降低了测序成本,为个体化基因诊断带来了希望。然而现在都存在或多或少的技术缺陷,没有实现商业化。以纳米孔测序法为例。溶血素七聚体是最常用于在脂质双分子层中制造生物纳米孔的材料,它性质非常稳定。但脂质双分子层的性质却不那么稳定,尤其是液态脂质双分子层,制造起来极难且费时。而使用离子束雕刻、电子束钻孔和原子层沉积等方法可以在氮化硅、氧化硅或其它金属氧化物等介质上“制作出”稳定的、有功能的固态纳米孔,不过要得到直径在1.5nm-2.0nm的纳米孔芯片还是一件非常困难的工作。现在,人们已经可以制作出装载有用于检测隧穿电流探针的纳米孔,但是目前的纳米孔制作工艺非常繁琐,速度慢又耗费人力,而且制作出的产品还常常无法达到应用的要求。此外,如何控制并减慢DNA分子通过纳米孔的速度,同时如何消除由于纳米孔表面相互作用给DNA分子跨孔动力学上造成的波动现象。这些问题都没有得到较好的解决,而这会影响检测信号的质量,甚至导致很多信号根本就检测不到,出现碱基漏检的情况。