最新测序仪HiSeq 2000 测序平台的特点
a. 通量高,每个run平均达到220G的数据通量,单次运行即可以大于30倍的覆盖度同时对两个人类基
因组样品进行测序,或同时绘制200个基因表达谱。
b. 成本较低,操作简易。
c.序列相对454较短,多数实验室只能达到101bp,在Macrogen可达到150bp。对于真核生物全基
因组de novo组装或以长转录本为研究目的的转录组组装,目前国际上尚未突破完全依赖HiSeq
2000或Solexa即可完成,即使是细菌基因组de novo组装,依然对这种技术提出了很大的挑战。
但对于于大规模的重测序研究以及SmallRNA、表达谱和表观组的研究, HiSeq 2000以其高通
量、低成本、易于操作的优势已成为是目前应用最广泛的测序平台。
Hiseq 2000测序平台的应用
由于序列相对较短,对于真核生物全基因组de novo组装或以长转录本为研究目的的转录组组装,目前国际上尚未突破完全依赖HiSeq2000或Solexa即可完成,即使是细菌基因组de novo组装,依然对这种技术提出了很大的挑战。但对于于大规模的重测序研究以及SmallRNA、表达谱和表观组的研究,HiSeq 2000以其高通量、低成本、易于操作的优势已成为是目前应用最广泛的测序平台。
重测序、芯片捕获序列分析
Small RNA测序
ChIP-Seq、甲基化和表观遗传学研究
全基因组de novo测序
转录组分析
宏基因组 Meta分析
Hiseq 2000的实验流程
a. 将基因组DNA或由反转录得来的cDNA打断
b. DNA 末端修复
c. 连接接头
d. DNA片段杂交到Flowcell上
e. DNA模板延伸,桥式扩增
f. Flowcell制备
g. HiSeq 2000自动化测序
Hiseq 2000的测序原理
Hiseq 2000的测序原理和Genome Analyzer II (Solexa)相似,是采用可逆终止法的边合成边测序技术。这种测序技术通过将基因组DNA的随机片断附着到光学透明的表面,这些DNA片断通过延长和桥梁扩增,形成了具有数以亿计cluster的Flowcell,每个cluster具有约1000拷贝的相同DNA模板,然后用4种末端被封闭的不同荧光标记的碱基进行边合成边测序。这种新方法确保了高精确度和真实的一个碱基接一个碱基的测序,排除了序列方面的特殊错误,能够测序同聚物和重复序列。
Solexa测序技术第二代分析系统Genome Analyzer IIx是当前世界上应用最为广泛的新一代测序系统,较当前普遍使用的一次只能读取1,000个左右的碱基,且DNA样品需要长时间的制备和分析的测序仪, 具有高准确性、高通量、高灵敏度和低运行成本等突出优势。可以同时完成传统基因组学研究以及功能基因组学研究。为目前遗传分析和功能基因组等研究领域提出 了全新的应用方案。
Solexa测序技术原理
首先将基因组DNA打断成几百个碱基的小片段(small RNA则经反转录形成cDNA),两端连接接头。随后,单链、两端有接头的DNA片段结合到表面带有单链引物的专利芯片上,形成“桥式”结构并进行扩增。 经过30轮扩增,每个单分子得到了1000倍扩增,芯片上形成了上百万个单克隆“DNA簇群”。
在接下来的合成测序反应过程中,向上述芯片中同时加入引物、四种不同荧光染料标记的核苷酸和DNA聚合酶。由于核苷酸的碱基末端被保护基团封 闭,因此每次反应只掺入一个碱基。经过扫描,读取该次反应的颜色后,该保护基团被除去,可继续进行下一轮反应。利用这种专利的“可逆性末端终结反应”,经 过反复循环,得到片段的精确序列。
Solexa测序技术特色
- 作为新一代测序技术,Solexa测序大大降低了测序成本,同时提高了测序效率;
- 每张芯片有8个通道,每个通道可单独运行一个样品,也可以把多个样品混合在一起检测;
- 一次单通道的测序可以得到不低于500万条的序列;
- 每次运行实验可读取10亿个碱基/芯片
- 可精确读取重复序列;
- 无需建库,自动化样品制备,简单,成本低;
- 样本使用效率极高,所以对少量样本也可以极灵敏精确地检测
- 每次测序长度为30 nt左右
1. 文库制备
将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。
2. 产生DNA簇
利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附 近的另外一个引物互补,也被“固定”住,形成“桥 (bridge) “。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序 列上。
3. 测序
Genome Analyzer系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。 这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一 轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。 这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。
4. 数据分析
自动读取碱基,数据被转移到自动分析通道进行二次分析。
Genome Analyzer系统的技术优势。
1. 可扩展的超高通量
Genome Analyzer系统目前每次运行后可获得超过20 GB的高品质过滤数据。这个技术的可扩展性保证了更高的数据密度和输出,能用更少的经费完成更复杂的项目。到今年底,通量还有望上升到95 GB,相当于人类基因组的30倍覆盖度。
2. 需要样品量少
Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。这也是很多研究人员所考虑的因素。
3. 简单、快速、自动化
Genome Analyzer系统提供了最简单和简洁的工作流程。即使是最小的实验室也能像大型基因组中心一样进行大规模的实验。制备样品文库可以在几小时内完成,一 个星期内就能得到高精确度的数据。Cluster Station可以说是Genome Analyzer的核心。由独立软件控制的自动生成DNA簇的过程可以在5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行 Emulsion PCR,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。
4. 新颖的测序化学技术
Genome Analyzer通过合成测序来支持大规模并行测序。利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的误差。
5. 单个或配对末端支持
Genome Analyzer系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和制备的时间。制备基因组DNA的单个片段或配对末端文库需要6个小 时,只有3个小时需要手工操作。2×50个碱基或更长的读长增加了比对基因组的能力,并拓展了在其他方面的应用。 |