ロングリードのメタゲノムのアセンブリを行う metaFlye

(Pacific BiosciencesまたはOxford Nanoporeシーケンサーによって生成された)一分子ロングシーケンシングリードによる細菌ゲノムアセンブリは、ショートシーケンシングリードアセンブリと比較して、アセンブリされたゲノムの隣接性を実質的に改善した。対照的に、初期のロングリードメタゲノム研究は単離細菌アセンブリと比較してより低い収率およびより短いリード長であることが報告され、これは高品質のアセンブリを生成することを困難にし、メタゲノム研究においてロングリードを利用するためにサンプル調製プロトコルを最適化しなければならないことを示唆する (​Tsai et al., 2016, Driscoll et al., 2017​)。しかしながら、高分子量DNA抽出技術における最近の改良により、複雑なメタゲノムを広範囲にカバーしそしてリード長を増してシーケンシングすることが可能になる (​Moss and Bhatt. 2018, Bertrand et al., 2018, Somerville et al., 2018, Nicholls et al., 2019​) 。これらの改良されたプロトコルは、複雑な細菌群集をシーケンシングするためにすでに使用されている(Bickhart et al、2018、Stewart et al、2018)。
 メタゲノムデータセットにはすでにいくつかのロングリードアセンブラ (Chin et al, 2016, Li, 2016, Koren et al., 2017, Kamath et al., 2017, Kolmogorov et al., 2019, Ruan and Li, 2019)が適用されているが、メタゲノムアセンブリ用に特別に設計されたものはない。ロングリードメタゲノムアセンブリはショートリードアセンブリの連続性を大幅に増加させ、分解能(Goltsman et al、2018)、水平遺伝子導入の検出(Guo et al、2018)、ならびに新規プラスミドおよびウイルスシーケンシング (​Arredondo-Alonso et al., 2017, Paez-Espino et al., 2016)、などの固有の限界に対処する可能性があるので、これは残念である。
 メタゲノムアセンブリは、サンプルを構成する種/株の非常に不均一なカバレッジ、長いゲノム内およびゲノム間リピートのために、単離された細菌のアセンブリと比較してさらなる計算上(Li et al、2015、Nurk et al、2017)、ならびにプラスミドおよびウイルスの再構築の困難性 (Antipov et al., 2019, Wick and Holt, 2019) の課題を提示している。著者らは最近、高速なロングリードのゲノムアセンブラFlyeを開発し、それが正確で連続的なアセンブリを生成することを示した(Kolmogorov et al、2019)。 2019年、Wick and Holtはさまざまな細菌データセットについてFlyeのベンチマークを行い、最先端のロングリードアセンブラを改良することを実証した。







Flye is available for Linux and MacOS platforms.


  • C++ compiler with C++11 support (GCC 4.8+ / Clang 3.3+ / Apple Clang 5.0+)
  • GNU make
  • Python 2.7
  • Git
  • Core OS development headers (zlib, etc)

Flye package includes some third-party software:

  • libcuckoo
  • intervaltree
  • lemon
  • minimap2
  • Graphviz (optional)
sudo apt install graphviz
mamba install -y -c bioconda graphviz

本体 GIthub

git clone 
cd Flye
python build

mamba install -c bioconda -y flye==2.9

"--meta"をつけてflyeを実行する。ここではnanoporeのraw read "--nano-raw"を指定している。必要であれば"--plasmids"もつける。 ”--genome-size”はv2.8から不要になった。

flye --nano-raw ONT.fq --out-dir outdir --threads 40 --meta --plasmids

flye --pacbio-raw CLR.fq --out-dir outdir --threads 40 --meta --plasmids
time (/usr/bin/time -v flye --nano-raw Zymo-GridION-EVEN-BB-SN.fq.gz --out-dir out_nano --threads 40 --meta --plasmids -g 60m)








Xeon Scarable Platinum P8180x1 、512GBメモリ環境にて実行。


