全ゲノムシークエンス(WGS)は、遺伝性疾患の原因となる変異を同定する方法として最も網羅的なものですが、急性疾患患者に用いる上でその所要時間が障壁になっています。ある原理実証試験で、スタンフォード大学医学部が率いる研究者チームが、効率的なサンプル調製と超高速なナノポア WGS、高速での変異コールおよび優先順位付けを組み合わせた新たなワークフローを開発し1,2、クリニカルリサーチサンプルの正確なゲノムワイド変異コールを過去最短の 8 時間以内に実 施できることを示しました2。
ショートリードに 基づく W G S を病 原性 変 異の 検 出に用いる際 にかかる時間が、迅速にデータを取得する必要がある状況ではボトルネックとなります2。Goenka らは、カバレッジの高いヒトナノポアW G S 用のエンドツーエンドワークフロー(図1) を 公 開して います。リアルタイムでのベースコール、シークエンスアライメント、小変異お よ び 構 造 変 異( S V ) の 高 速 で の コ ー ル と フ ィ ル タ リ ン グ と 併 せ て 、シークエンスに要する時間は 2 時間です。同チームは、ヒトリファレンスゲノムサンプル(HG002)を用いてこの方法を最適化し、12 種類のクリニカルリサーチサンプルにこのワークフローを適用して1、8 時間以内に原因変異候補を同定できることを示しました2。
これを達成するに当たり、同チームは効率的なサンプル調製に重点を置き、限られた量の血液から十分な量の高品質ゲノム DNA を抽出できるように標準的なライブラリ調製プロトコールを作成し、PromethION 48 の 48 枚のフローセル全てにシークエンス作業を割り当てられるようにしました2。フローセルを複数のサンプルに再利用することによってサンプル当たりのコストが削減できます。
"..PromethION プラットフォームは 4 8 枚のフローセルを搭 載でき、 1 個のサンプルを 2 時間で臨床品質の カバレッジまでシークエンスすることが 可能です"
サンプ ル の キ ャリー オ ー バ ー を 避 けるに は 、 ランごとに W a s h キットによりヌクレアーゼ洗浄を実 施すれば十分であることが 確認されました。約 2 時間以内のシークエンスにより、ダウンストリームの変異コール用に高収量(200 Gb のシークエンスデータ)を得ることができました。
同チームはランタイムを削減するため、超並列処理と GPU アクセラレーションを備えたクラウドベースのモジュール(Google Cloud Platform)を開発し、シークエンスの進行中にリアルタイムで高精度なベースコールとシークエンスアライメントを実施できるようにしま
図1 超高速なエンドツーエンドの全ゲノムナノポアシークエンスパイプライン(サンプル採取から変異候補の同定まで)の概要。並行して実施する手順は垂直方向に配置しています。このパイプラインを用いることにより、検討したいずれのサンプルでも 8 時間以内に変異候補を同定することができました。図の出典:Goenka et al. 20222.
した。また、変異コールパイプラインの高速化も実現しました。さ ら に 、同 研 究 者 ら は 、フェ ーズ 情 報 を 用 い る こ と が 特 に 重 要 で あ り 、大 きくて 複 雑 な ゲノムで は 変 異 コ ール 性 能 が 目 に 見 えて 上 昇 すると述べています。
変 異フィル タリング お よ び 優 先 順 位 付 け に 従 来 の 方 法 を 用 いた 場 合のもう一つの難点として、同定される候補の数の多さ(最大 100 程度)があり、きわめて迅速な対応を迫られる臨床現場に WGS を今後応用する上で 障 壁になることが 考えられます。「迅速な対応を迫られる現場においての目標は、既知の疾患遺伝子の変異のうち、病原性が明らかで治療標的になり得るものの変異を迅速に検出するこ と で し た 。」 そこで、研究者らは、変異候補を効果的にフィルタリングおよびキュレーションする方法の開発にも注力しました。超 高 速 なエンドツーエンドワークフローの 最 終 段 階 です(図1)。
Goenka らは、重症 SARS-CoV-2 感染症と併存疾患を発症し、重篤な状態にある 57 歳の男性、および筋緊張異常/後弓反張と発達遅滞の既往がある 14 ヵ月の女児(診断検査の結果が確定的でなく、遺伝性のものである可能性が示唆されました)から得た 2 つのクリニカルリサーチサンプルに同チームのワークフローを適用し、リアルワールドでの性能を示しました2。新生児のサンプルについては 、 標 準 システムで 確 認 さ れ た 変 異 が 1 4 7 個 で あった の に 対して、31 個の小変異と 21 個の構造変異が同定され(手動によるレビュー)、同研究者らの変異コールとフィルタリングパイプラインの方が標準的な 方 法 よ り も 優 れ て い る こ と が 示 さ れ ま し た(図2)。
いずれの患者の場合も、約 2 時間でナノポア WGS が高いカバレッジに達し、サンプル調製を開始してから 7 時間以内に変異コールとアノテーションが完了し、8 時間以内に変異候補を特定することができました。
図2 クリニカルリサーチサンプルを用いた標準変異フィルタリングパイプラインと超高速変異フィルタリングパイプラインの比較。標準パイプラインでは 147 個の変異が確認されたのに対して、超高速パイプラインで同定された変異はわずか 31 個で、変異候補の手動によるレビューに必要な時間が大幅に減少することになります。図の出典:Goenka et al. 20222.
Whole-genome sequencing (WGS) is the most comprehensive technique for identifying the variants underlying genetic diseases; however, the turnaround time required for such an approach is a barrier to its adoption for acutely ill patients. In a proof-of-principle study, a group of researchers, led by Stanford University School of Medicine, developed a novel workflow combining efficient sample preparation, ultra-rapid nanopore WGS, and accelerated variant calling and prioritisation1,2, demonstrating the ability to perform accurate genome-wide variant calling in clinical research samples in under 8 hours — the fastest turnaround time to date2.
The lengthy timelines associated with short-read-based WGS for pathogenic variant detection limit its potential application in settings where rapid data is required2. Goenka et al. presented an end-to-end workflow (Figure 1) for high-depth human nanopore WGS, requiring two hours of sequencing, in combination with real-time basecalling, sequence alignment, and accelerated small variant and structural variant (SV) calling and filtration. Optimising their approach on a human reference genome sample (HG002), the team demonstrated the application of this workflow to 12 clinical research samples1, achieving sample to identification of candidate causative variants in under eight hours2.
To achieve this, the team focused on efficient sample preparation, adapting the standard library preparation protocol to generate sufficient high-quality genomic DNA from a limited volume of blood, to allow distributed sequencing over all 48 flow cells of a PromethION 482. Per-sample cost could be reduced by reusing the flow cells for multiple samples, with a nuclease wash found to be sufficient between runs to avoid sample carryover. Within approximately two hours of sequencing, a high yield (200 Gb of sequence data) could be generated for downstream variant calling.
To reduce runtime, the team developed a cloud-based module (Google Cloud Platform) with massive parallelism and GPU acceleration, allowing high-accuracy basecalling and sequence alignment to be performed in real time whilst sequencing progressed. They also accelerated their variant calling pipelines. The researchers additionally noted that the utilisation of phase information was particularly valuable, with gains in variant calling performance clearly apparent for large and complex genes.
Figure 1. Overview of the ultra-rapid, end-to-end, whole-genome nanopore sequencing pipeline, from sample collection to candidate variant identification. Steps performed in parallel are vertically stacked. Using this pipeline, a candidate variant was found within eight hours for both samples studied. Figure adapted from Goenka et al. 20222.
Another challenge of traditional variant filtering and prioritisation approaches is the high number (~100) of candidates identified, which could potentially limit the future applicability of WGS in an ultra-rapid clinical setting; 'for application in the ultra-rapid setting, our goal was to readily surface clearly pathogenic, actionable variants in established disease genes'. The researchers therefore also focused on developing effective filtration and curation of candidate variants — the final stage in their ultra-rapid, end-to-end workflow (Figure 1).
Goenka et al. demonstrated the performance of their workflow in a real-world setting, applying it to two clinical research samples derived from a critically ill 57-year-old male with severe SARS-CoV-2 infection and comorbidities, and a 14-month-old female infant with history of dystonic/ opisthotonic posturing and developmental delay, for whom diagnostic testing proved inconclusive, suggesting possible genetic aetiology2. Demonstrating the power of their variant calling and filtration pipeline compared with the standard approach, for the neonate sample, filtration identified 31 small variants, and 21 structural variants, for manual review, compared with 147 variants via the standard system (Figure 2).
For both individuals, high-depth nanopore WGS was achieved in approximately two hours, variant calling and annotation were completed within seven hours from the start of sample preparation, and a candidate variant was obtained within eight hours.
Figure 2. Comparison of the standard and ultra-rapid variant filtration pipelines using a clinical research sample. With only 31 variants obtained via the ultra-rapid pipeline, compared to 147 variants found through the standard pipeline, the time required for manual review of candidate variants would be significantly reduced. Figure adapted from Goenka et al. 20222.
- リアルタイムで の ベ ースコールとアライメントを実現し、過去最短の所要時間を達成
- 小変異と構造変異の正確なゲノムワイドコールを可能に
- 柔 軟 か つ ハ イス ル ープット の 全 ゲノム シ ー ク エ ン スを実現