冰山一角:生菜基因组测序

Iceberg lettuce

荷兰 KeyGene 的科学家走在作物创新的最前沿,他们与合作伙伴一起研究各种重要的经济作物,包括蔬菜、大田作物和花卉。重点关注通过培育诸如病原体抗性、更长的保质期、更好的味道、颜色、易于包装等性状来改进作物,他们最近开发了可以用于都市农业的在LED照明下生长的作物品种。其中一个例子是他们成功培育抗蚜生菜品种,大大减少了农药的使用1

生菜(Lactuca sativa)是一种重要的作物, 全球每年生菜收成740亿棵。为了进一步加强生菜育种工作,KeyGene 的团队使用高产出、高通量的PromethION 平台对两个生菜株系进行了全基因组测序1。 两个株系分别仅使用了7个和9个测序芯片,就获得了100x 的基因组覆盖度。*

使用 minimap2 和 miniasm 对一个生菜株系的数据子集进行从头组装(40x覆盖度),用 以快速评估基因组的结构完整性。该团队报告称,从头组装包含1,169 个 contig, contig N50 为 7.3 Mb1 ,覆盖 2.6 Gb,几乎代表了整个生菜基因组。这项研究的首席科学家之一 Alexander Wittenberg 博士说, 这些结果毫不逊色于最新发表的参考基因组。参考基因组使用短读长测序技术和复杂的 scaffolding 方法,产生了 21,116 个 contig 和 2.21 Gb 大小的组装基因组1。他进一步指出,与花费数年时间生成的参考组装不同,纳米孔组装是在收到样本后两个月内获得的1。 

在与短读长参考组的比对中显示出显著的结构差异,表明公开的参考组中可能存在错误。

为了验证他们纳米孔测序的结果,KeyGene 的团队对生菜基因组使用了光学图谱。最大的纳米孔contig 为32 Mb,显示与光学图谱实现完美比对; 然而,与短读长参考组的比对显示出显著的结构差异,表明公开的参考组中可能存在错 误。结合纳米孔和光学图谱数据,能够生成146 Mb 的 scaffold N50,仅 34 个 scaffold 就可以生成接近染色体水平的组装1

Wittenberg 博士在评论这项研究时说:

“PromethION是真正的颠覆者,它将超长读长与高测序输出相结合,用于产生连续的高质量参考基因组。利用这个平台,我们只用几个测序芯片,就能以超过 100X 的覆盖度对 2.56Gb 的生菜基因组进行测序1

该团队现在计划为他们的两个生菜株系分析完整的100x覆盖度数据集,用来支持这一重要作物的育种工作。

case study figure 2.PNG
图:生菜基因组比对表明短读长参考组装中 contig 有潜在的方向错误。(a)光学图谱和纳米孔基因组组装显示出完全一致性,而 (b)光学图谱和短读长参考组装之间存在显著的结构差异。数据由荷兰 KeyGene的Alexander Wittenberg 博士提供。 

* 测序芯片的产出预计会进一步增加,目前(2018年夏季)报告为每个 PromethION 测序芯片的产出超过100 Gb2, 而 Oxford Nanopore 的内部结果显示,每个测序芯片产出的数据接近 200 Gb。

本研究案例来源于植物白皮书。

下载植物白皮书

References

  1. Wittenberg, A. PromethION sequencing of complex plant genomes. Presentation. Available at: https://nanoporetech.com/resource-centre/ talk/promethion-sequencing-complex-plant-genomes. [Accessed: 14 June 2018]
  2. Albertsen Lab. >100 Gb on 1 flowcell outside ONT. Online. Available at: http://albertsenlab.org/100-gbp-on-1-flowcell-outside-ont/ [Accessed: 02 July 2018]