测序在生命科学研究中一直发挥着重要作用。以Sanger法(双脱氧核苷酸末端终止法)为代表的第一代测序技术帮助人们完成了从噬菌体基因组到人类基因组图谱等大量测序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基因组时代最理想的测序方法。
进入21世纪后,以Roche 454、Illumina Solexa和ABI SOLiD为代表的第二代测序技术诞生了,并迅速掀起了你追我赶的技术比拼高潮。2010年,Illunima和ABI先后发布新款测序仪,改进了原有机型,测序通量不断提升,测序成本不断降低,现在已经进入了数千美元测一个人全基因组的时代。
第二代测序技术进展
1. Roche 454测序技术
454公司可谓第二代测序技术的奠基者。2005年底,454公司推出了革命性的基于焦磷酸测序法的高通量基因组测序系统--Genome Sequencer 20 System。这一技术的建立开创了边合成边测序(sequencing by synthesis)的先河,被nature杂志以里程碑事件报道。之后,454公司被罗氏诊断公司以1.55亿美元收购。一年后,他们又推出了性能更优的第二代基因组测序系统--Genome Sequencer FLX System(GS FLX)。2008年10月,Roche 454在不改变机器的情况下,推出了全新的测序试剂--GS FLX Titanium,全面提升了测序的准确性、读长和测序通量。
目前,Roche 454 GS FLX Titanium每次运行能产生100万条序列,平均读长能达到400nt,且第400个碱基的准确率能达到99%。一次运行所需时间为10小时,能获得4-6亿个碱基的序列信息。
2. Illumina Solexa测序技术
Illumina公司的第二代测序仪最早由Solexa公司研发,利用其专利核心技术"DNA簇"和"可逆性末端终结(reversible terminator)",实现自动化样本制备和大规模并行测序。Illumina公司于2007年初花费6亿美金巨资收购了Solexa。2010年初,Illumina将其第二代测序仪Genome Analyzer IIx升级到HiSeq 2000。
HiSeq 2000含有两张Flow cell,可同时运行或者只运行其中一张。读长为100nt,同时支持Fragment、Pair-end和Mate-Paired文库。每次运行最多可产生200 GB的数据量(读长为2x100nt)。
3. ABI SOLiD测序技术
过去20年,美国应用生物系统公司(ABI)在一代测序方面一直占据着垄断地位。第二代测序技术出现以来,ABI公司不甘落后,迅速赶上,于2007年底推出了SOLiD 第二代测序平台。2010年末又发布了最新产品--SOLiD 5500xl测序平台。从SOLiD到如今的SOLiD 5500xl,短短三年时间,连升五级,发展速度惊人。
SOLiD全称为Supported Oligo Ligation Detetion,它的独特之处在于它以四色荧光标记寡核苷酸的连续连接反应为基础,而没有采用传统的边合成边测序技术。连接反应没有DNA聚合酶合成过程中常有的错配问题,而SOLiD特有的"双色球编码技术"又提供了一个纠错机制,这样设计上的优势使得SOLiD在系统准确性上大大领先于其它平台。
目前最新款SOLiD 5500xl含有两张微流体芯片(microfluidic FlowChip),每张芯片含有6条相互独立的运行通道(run lane)。每条lane都能运行相对独立的测序反应,这样的设计使得SOLiD 5500xl测序平台极具灵活性。最大测序读长为75nt,同样支持Fragment、Pair-end和Mate-Paired文库。单次运行能得到的最大数据量为300Gb(使用最新设计的nanobeads)。测序的系统准确性能达到99.99%。
第二代测序技术的应用
技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行重头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。
这边需要特别指出的是第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术(Targeted Resequencing)。这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序。目前提供序列捕获的厂家有Agilent和Nimblegen ,应用最多的是人全外显子组捕获测序。科学家们目前认为外显子组测序比全基因组重测序更有优势,不仅仅是费用较低,更是因为外显子组测序的数据分析计算量较小,与生物学表型结合更为直接。
目前,外显子组测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和SOLiD对四位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每个个体产生了2.7-3 GB可作图的序列数据。他们聚焦于全部四位患者都携带变异体的12个基因,最终将候选基因缩小至1个。而贝勒医学院基因组测序中心也计划对15种以上疾病进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。前不久刚刚结束的Science杂志年度十大科学突破评选中,外显子组测序名列其中。
以上我们盘点了2010年第二代测序技术的最新进展和相关应用。但是除了第二代测序之外,还有另外一种以单分子实时测序和纳米孔为标志的第三代测序技术也正在如火如荼的发展中,只是还没有正式发布。所以目前科学界所说的高通量测序还指的是第二代测序。