使用癌细胞系对 RNA 测序试剂盒进行的系统性评估

rna

在转录组学中,很少有一个基因一种产物的模式。预测表明,每个基因平均具有 6.3 个转录本异构体 1,人类基因组中 95% 的复合外显子基因都有选择性剪接 2。多种异构体的产生显著增加了基因表达的复杂性,从而也增加了基因分析的复杂性。

短读长 RNA 测序可受到系统偏向性的影响,例如GC偏向性和PCR偏好性,而这些可以通过使用纳米孔 RNA 测序方法来避免,尤其是使用无需扩增的方法。作为新加坡纳米孔—表达联盟(Singapore Nanopore-Expression Consortium)的一员,Jonathan Goke 博士从六株细胞系中生成了纳米孔测序数据,并通过直接RNA测序、或cDNA介导的测序(无论有无PCR扩增)生成全长 RNA 序列的纳米孔方法进行了评估。此外,Jonathan 希望建立质控和生物信息学工作流程,用于分析 RNA 测序数据和研究样本变差(sample variation)。

表 1 中显示了三种Oxford Nanopore RNA 测序试剂盒的起始样本要求和一般信息。Jonathan 在所有试剂盒上所获得的平均读长均超过 1000bp,其中,直接cDNA 测序试剂盒的读长最长。测试试剂盒和测试样品之间存在高度的技术重现性。

 

表 1 Oxford Nanopore Technologies RNA 测序试剂盒

研究人员就长读长纳米孔 RNA 测序与短读长 RNA 测序方法进行了进一步的直接比较,发现短读长和长读长在基因水平上有非常高的相关性。这表明,纳米孔长读长数据与先前的短读长测序实验的数据“向后兼容”。然而,长读长纳米孔测序额外提供了偏向性更小且更为富集的数据集:首先,使用长读长纳米孔测序显著减少了短读长数据中存在的 3’端偏向性;其次,很少有短读长可跨越一个或多个剪接位点,而长读长数据则具有更好的读长分布,因此跨越多个剪接位点;最后,与短读长数据不同,纳米孔方法生成的大多数序列都定位到了单个参考转录本。

总体而言,与短读长数据相比,长读长RNA 测序数据中的偏向性显著降低,且在重复、实验步骤和平台上呈现出高度的一致性。

RNA and cDNA sequencing kits

References

Pan et al. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing. Nature Genetics. 40, 1413-1415 (2008)

The ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 489, 57-74 (2012)

Open a chat to talk to our sales team