ナノポアのロングリードにより神経変性疾患に おけるリピート配列伸長の包括的な特性解析 を実施


ヒトゲノムでは、これまでに約 500,000 のタンデムリピート配列(TR)が同定されています。この TR は変異性が高く、 顕著な伸長傾向が認められます 1 。この伸長リピート配列は、筋萎縮性側索硬化症や前頭側頭型認知症など、多くの 神経疾患に関与しています 2 。しかし、その臨床的意義が明白でありながら、未だ十分には解明されていません。この 伸長領域は、その反復性、GC 含量の多さ、長さが原因となって、PCR 増幅が困難であり、ショートリードでは多くの 場合に伸長領域全体をカバーできないためです。以上の理由から、ショートリード技術を使ったシークエンス解析では 通常、リピート配列伸長を塩基レベルで解析することはできません。

リピート配列伸長の特性解析が技術的に困難である一方で、リピート 配列の長さと疾患発症時の年齢、症状の重症度との間に負の相関 があることが研究によって示されています3。また、リピート配列の メチル化状態と塩基組成の両方によって疾患の表現型が変化する ことも示されています。以上の観察結果から、リピート配列伸長の 包括的な特性解析を実施し、疾患における役割を解明するためには、 リピート配列の長さ、メチル化状態、塩基組成を明らかにする必 要があることが示唆されています。

"TR TR 長とシークエンスの両方について 高い 1リード当たり精度が得られ、TR の 研究に新たな道を開くものとなった4"

他の技術ではリピート配列伸長の解析が困難であるため、ベルギー のVIB Center for Molecular Neurologyを拠点とするSleegersらは、 Oxford Nanopore 社の PromethIONTM により作成したロングリードを 用いてABCA7 リピート配列伸長がアルツハイマー病において果た す役割を調査しています4 。同グループは、過去にサザンブロッティ ングによってABCA7 可変数タンデムリピート配列(VNTR)のア レルサイズが推定されていた患者 11 例からゲノム DNA を得て、シー クエンスを実施しました。また、その解析のために、核酸がナノポア他の技術ではリピート配列伸長の解析が困難であるため、ベルギー のVIB Center for Molecular Neurologyを拠点とするSleegersらは、 Oxford Nanopore 社の PromethIONTM により作成したロングリードを 用いてABCA7 リピート配列伸長がアルツハイマー病において果た す役割を調査しています4 。同グループは、過去にサザンブロッティ ングによってABCA7 可変数タンデムリピート配列(VNTR)のア レルサイズが推定されていた患者 11 例からゲノム DNA を得て、シー クエンスを実施しました。また、その解析のために、核酸がナノポア を通過する際に生じる電流のかく乱(squiggle)の Raw リードか らリピート配列の長さと組成を明らかにするツールである NanoSatellite を開発しました(図 1)。同グループは、このワーク フローを用いて「伸長領域を含む ABCA7 VNTR の全長」を解析し、「高 品質の TR 長とシークエンス」の両方を取得しました。

NanoSatellite ABCA7 VNTR length estimates for all individuals
Figure 1: 図 1 NanoSatellite ABCA7 VNTR 長の推定値(全患者)。プラス鎖(赤色)またはマイナス鎖(青色)当たりのタンデムリピート 配列単位数(y 軸に表示)を、サザンブロッティングにより推定された長さ(黒色破線)との比較で図示しました。画像は 以下を修正:De Roeck et al. 20194

ベルリンにあるマックス・プランク分子遺伝学研究所の Franz-Josef Müller らのチームは、ナノポアのロングリードを活用して筋萎縮性 側索硬化症の原因となるC9ORF72 リピート配列伸長の特性解析を 実施しました2。C9ORF72 リピート配列を有するクリニカルリサーチ サンプルから DNA を取得し、Cas9 ターゲットエンリッチメントを 用いてC9ORF72 領域のエンリッチメントを行い、1 枚の MinIONTM Flow Cell でサンプルをシークエンスしています。このワークフロー により、C9ORF72 のエンリッチメントが非ターゲット全ゲノムシーク エンスの約 8 倍になりました。同チームは解析用に、 NanoSatellite と同じようにナノポアの squiggle の Raw リードを解 析し、さらにアライメント段階を経た後、伸長領域内のリピート配 列数を正確に定量するツールである STRique を開発しています。

さらに、このエンリッチメント法ではエピジェネティック修飾も維持 されるため、同チームはリピート配列のメチル化含量を検討しました。 増幅ベースの方法では不可能だったことです。総合的に見て、 Giesselmann らはナノポアシークエンスの価値を明確に示しており、 「リピート配列数の正確な定量と併せてリピート配列伸長領域の CpG メチル化状態の確定」が可能になったとしています2

Approximately 500,000 tandem repeats (TRs) have been identified in the human genome. These TRs are highly mutable with a notable propensity to expand1. It is these expanded repeats that are implicated in many neurological diseases, including amyotrophic lateral sclerosis and frontotemporal dementia2. Yet, despite their obvious clinical significance, they remain poorly understood; due to their repetitive nature, high GC content, and length, these expansions are refractory to PCR amplification and often cannot be spanned by short reads. For these reasons, repeat expansions are generally precluded from base-level resolution by sequence analysis based on short-read technologies.

Despite the technical challenges faced in characterising repeat expansions, research has demonstrated that there is a negative correlation between repeat length and the age of disease onset as well as symptom severity3. Both methylation status and base composition of the repeat have also been shown to alter disease phenotype. These observations suggest that to comprehensively characterise repeat expansions and understand their role in disease, the repeat length, methylation status, and base composition need to be determined.

'We achieved high single-read accuracy for both TR length and sequence, which opens novel avenues in TR research'

Roeck, A.D. et al. Genome Biol. (2019)

Due to the limited capacity of other technologies to resolve repeat expansions, Sleegers and colleagues based at the VIB Center for Molecular Neurology, Belgium, used long reads produced by Oxford Nanopore's PromethION device to investigate the role of the ABCA7 repeat expansion in Alzheimer's disease4. The group sequenced genomic DNA from 11 individuals who previously had their ABCA7 variable number tandem repeat (VNTR) allele size estimated using Southern blotting. For their analysis they developed NanoSatellite — a tool to determine repeat length and composition from the raw nanopore squiggle data (Figure 1). Using this workflow, they resolved 'all ABCA7 VNTR lengths, including expansions', which allowed them to obtain both 'high-quality TR length and sequence determination'.

human genomics case study figure 1

Figure 1: NanoSatellite ABCA7 VNTR length estimates for all individuals. The number of tandem repeat units (displayed on the y axis) per positive strand (red) or negative strand (blue) is shown in comparison to the lengths estimated via Southern blotting (dashed black lines). Image modified from De Roeck et al. 20194.

Franz-Josef Müller's team, at the Max Planck Institute for Molecular Genetics in Berlin, leveraged long nanopore reads to characterise amyotrophic lateral sclerosis causative C9ORF72 repeat expansions2. DNA was obtained from clinical research samples harbouring the C9ORF72 repeat; they then enriched for the C9ORF72 region using Cas9-mediated targeted enrichment, and sequenced samples on a single MinION Flow Cell. The workflow enabled an ~8-fold enrichment of C9ORF72 compared to non-targeted whole-genome sequencing. For their analysis, they developed the tool STRique, which, akin to NanoSatellite, analyses raw nanopore squiggle data, and after further alignment steps, accurately quantifies the number of repeats within an expansion.

Furthermore, as this method of enrichment also preserves epigenetic modifications, the team explored the methylation content of the repeat — something which would not have been possible if an amplification-based method had been used. Overall, Giesselmann and colleagues demonstrated the value of nanopore sequencing, which enabled 'precise quantification of repeat numbers in conjunction with the determination of CpG methylation states in the repeat expansion'2.

Find out more about human genomics research
  1. Fazal, S. et al. Large scale in silico characterization of repeat expansion variation in human genomes. Sci. Data 7(1):294 (2020). DOI: https://doi.org/10.1038/s41597-020-00633-9

  2. Giesselmann, P. et al. Analysis of short tandem repeat expansions and their methylation state with nanopore sequencing. Nat. Biotechnol. 37(12): 1478–1481 (2019). DOI: https://doi.org/10.1038/s41587-019-0293-x

  3. Paulson, H. Repeat expansion diseases. Handb. Clin. Neurol. 147:105–123 (2018). DOI: https://doi.org/10.1016/b978-0-444-63233-3.00009-9

  4. De Roeck, A. et al. NanoSatellite: accurate characterization of expanded tandem repeat length and sequence through whole genome long-read sequencing on PromethION. Genome Biol. 20(1):239 (2019). DOI: https://doi.org/10.1186/s13059-019-1856-3