高品質、低コスト、ナノポアのみの 細菌ゲノムシークエンス

リファレンス品質の細菌ゲノムアセンブリを得るには多くの場合、純培養またはメタゲノムサンプルのシークエンス により得られたデータを使用します。これまではこの用途にショートリードシークエンス技術が選択されてきま したが、ライブラリのインサートサイズよりも長い反復配列を検出できないという制限があります。そのため、 そのようなサンプル由来のゲノムをアセンブリする目的で、Oxford Nanopore 社のプラットフォームなどのロング リードを作成できる技術が「最近になって選択肢として登場」しました 1 。

デンマークのオールボー大学を拠点とする Albertson 教授らは、 ナノポアシークエンスデータのみを用いてリファレンス品質の細菌 ゲノムアセンブリが得られるかどうかを調査しました1 。調査の結果、 以前はほぼ完全な細菌ゲノムアセンブリを得るのにショートリード またはナノポアデータのリファレンスポリッシングが選択される傾向 にありましたが、コストと複雑さが増すため望ましい選択肢では ないことが確認されています 1 。

同チームは、「純培養」(この場合はモックコミュニティー)と活性 汚泥サンプル由来のシークエンスデータを取得し、細菌ゲノムアセ ンブリでナノポアケミストリ R9 および最新の R10 の性能を評価し ました。

また、ショートリードポリッシングを用いてもコンセンサス配列が 大きく改善することはないと考えられる場合に、ナノポアのロング リードのみを用いてアセンブリした高品質ゲノムの作成を指すために、 「ほぼ完成した」ゲノムという用語を導入しています。同研究者らは、

Indels observed per 100 kb

図 1 新規細菌分離株アセンブリで 100 kb 当たりに観察された INDEL(さまざまなカバレッジ、ショートリードポリッシングを実施した場合と実施しない 場合)。報告者らは、ケミストリとして R10.4 を用いて取得したナノポアデータのショートリードポリッシングを実施しても、アセンブリ品質が著しく 改善することはなかったと述べています。画像の出典:Sereika et al. 1 。Creative Commons ライセンス(creativecommons.org/licenses/by/4.0) の下で公開。

ポリッシングを実施することなく、R10.4 データのみからほぼ完成 した細菌ゲノムを作成できることを確認しました(図 1)。これを達成 するのに必要としたカバレッジは約 40 倍でした。同チームはメタ ゲノムアセンブリを対象に性能を評価するため、活性汚泥サンプル をシークエンスしたところ、ケミストリとして R10.4 を用いることに より、ショートリードポリッシングを実施することなくほぼ完成した 微生物ゲノムを作成できるというほぼ同じ結論に達しています 1 。

Mycobacterium tuberculosis は結核の病原菌です。結核は今なお 致死率の高い感染症であり、2020 年には 150 万人が結核により 死亡しています 2。結核を効果的にコントロールする上で、薬剤耐性 M. tuberculosis が特に重大な脅威となっています2,3。

以前であれば、耐性の遺伝的基盤や結核感染を担うゲノム学的側面 の調査にはショートリードシークエンス技術が使用されていました。 しかし、M. tuberculosis のゲノムは GC 含量が多く反復性が高い ためにショートリードでは検出が困難です。例えば、変動が大きい GC リッチなpe/ppe 遺伝子は薬剤耐性と関連がありますが、 ショートリードを用いた場合にはゲノムに正確にマッピングするのが 困難であるため、多くの場合に解析の対象外となります。さらに、 このようなシークエンスプラットフォームには多くの資本コストと 集約化を必要とするため、結核の負荷が大きく所得の少ない多くの 地域では、全ゲノム解析の実施が難しい状況がありました 3。

それに対して、Oxford Nanopore 社のプラットフォームでは、あら ゆる長さのシークエンスリードを作成でき、in situ シークエンスに 適したポータブル型のものなど幅広い規模の機器を用意しています。 そのため、Oxford Nanopore 社の技術は結核ゲノム解析への 「応用に有望なプラットフォーム」であると認識されています 3。

"Oxford Nanopore 社の R10.4 を 用いれば、ショートリードポリッシング を実施することなく、40 倍の カバレッジで純培養またはメタゲノム 由来のほぼ完成した微生物ゲノムを 作成することができる1"

この現状を踏まえ、Gómez-González らがナノポア技術とショート リード技術により 10 株のクリニカルリサーチ用M. tuberculosis 分離株をシークエンスしたところ、マッピング後のカバレッジが ショートリードは 93.6 倍、ナノポアは 72.2 倍となりました3 。同チームは、ショートリードにより正確にアライメントすることができなかった 反復配列では、ナノポアのロングリードのカバレッジに改善が得ら れたことを明らかにしています。予測通り、ナノポアのロングリードで より多く大型変異体が検出されました(分離株全体で中央値 81 vs. 24)。また、すべてのサンプルペアで、一塩基多型(SNP)の 99% を両サンプルでコールでき、プラットフォーム間の差異はほとんど ありませんでした。リネージに関する予測結果はいずれも両プラット フォームで同じものになりましたが、ナノポアデータに絞って見て みると、ナノポアのロングリードではpe/ppe 遺伝子領域の検出に 成功したため、この領域の SNP を組み込んでリネージ解析を実施 することができました。こうして解析精度が向上したことは、「アウト ブレイク発生状況では特に有意義で、類縁性の高い分離株の感染 伝播解析を充実させられる可能性がある」と考えられます。また、 ロングリードにより反復配列をカバーできることから、M. tuberculosis の薬剤耐性機序について理解を深められる可能性が 示唆されました 3 。

参考文献

  1. Sereika, M. et al. Nat. Methods. 19, 823–826 (2022).

  2. WHO. Tuberculosis. Available at: https://www.who.int/news-room/fact-sheets/detail/tuberculosis [Accessed: 23 August 2022]

  3. Gómez-González, P.J. et al. Briefings in Bioinformatics. bbac256, https://doi.org/10.1093/bib/bbac256 (2022)