macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ハイブリッドアセンブリとビニング及び下流解析を行う自動化されたパイプライン MUFFIN

2021 2/5,2/6 出力例追記

2021 2/11 論文引用

 

メタゲノミクスは微生物学の多くの分野を再定義した。しかし、メタゲノムアセンブルゲノム(MAG)は、主にショートリードでシーケンスが行われた場合、断片化されていることが多い。最近のロングリードシーケンシング技術は、ゲノム再構成を改善することを約束している。しかし、2つの異なるシークエンシング技術を統合すると、下流の解析が複雑になる。そこで著者らは、ショートリードとロングリードを用いて高品質のビンとそのアノテーションを生成する完全なメタゲノムワークフローであるMUFFINを開発した。このワークフローは、ワークフローオーケストレーションソフトウェアであるNextflowを用いて記述されており、高い再現性と高速かつ簡単な使用を実現している。このワークフローはまた、ビンの分類学的分類とKEGGパスウェイを生成し、定量化とアノテーションのためのRNA-Seqデータ(オプション)を提供することができる。20 個のバイオガスリアクターサンプルを用いてワークフローをテストし、微生物群集とその機能を解析するために必要なファイルを処理して出力する MUFFIN の能力を評価した。MUFFINは機能パスウェイの予測を行い、提供された場合には、メタゲノムサンプルと各ビンのデノボ転写産物のアノテーションを生成する。

 

  

 

f:id:kazumaxneo:20200303213638p:plain

The Workflow. Githubより転載

 

公開当初は一部プロセスが開発中でランできなかったが、その後バージョンアップによって全プロセスが通しでランできるようになった(らしい)。

 

インストール

依存

  • nextflow
  • conda

本体 Github

nextflow run RVanDamme/MUFFIN --parameters

nextflow run RVanDamme/MUFFIN --parameter -profile local,docker

$ nextflow run RVanDamme/MUFFIN --parameter -profile local,docker

N E X T F L O W  ~  version 20.07.1

Launching `RVanDamme/MUFFIN` [extravagant_cuvier] - revision:

347367e00d [master]

[-        ] process > sourmash_download_db   -

[-        ] process > sourmash_download_db   [  0%] 0 of 1

[-        ] process > discard_short          -

[-        ] process > merge                  -

[-        ] process > fastp                  -

[-        ] process > spades                 -

[-        ] process > minimap2               -

[-        ] process > bwa                    -

[-        ] process > metabat2               -

[-        ] process > maxbin2                -

[-        ] process > concoct                -

[-        ] process > refine3                -

[-        ] process > checkm                 -

[-        ] process > sourmash_bins          -

[-        ] process > sourmash_checkm_parser -

[-        ] process > eggnog_download_db     [  0%] 0 of 1

[-        ] process > eggnog_bin             -

[-        ] process > parser_bin             -

[-        ] process > readme_output          [  0%] 0 of 1

 

*********Start running MUFFIN*********

MUFFIN is a hybrid assembly and differential binning workflow for

metagenomics, transcriptomics and pathway analysis.

 

If you use MUFFIN for your research pleace cite:

 

https://www.biorxiv.org/content/10.1101/2020.02.08.939843v1

 

or

 

Van Damme R., Hölzer M., Viehweger A., Müller B., Bongcam-Rudloff E.,

Brandt C., 2020

"Metagenomics workflow for hybrid assembly, differential coverage

binning, transcriptomics and pathway analysis (MUFFIN)",

doi: https://doi.org/10.1101/2020.02.08.939843

**************************************

 

No files match pattern `*_R{1,2}.fastq{,.gz}` at path: ./illumina/

No files match pattern `*.fastq{,.gz}` at path: ./nanopore/

 

 

 

テストラン

#test locally with conda
nextflow run RVanDamme/MUFFIN --output results_dir --cpus 8 --memory 32g -profile local,conda,test

#test locally with docker (docker実行権限がユーザに無いならsudo実行)
nextflow run RVanDamme/MUFFIN --output results_dir --rna -profile local,docker,test

実行するとdockerイメージのダウンロードやcondaの環境が作られ、ジョブが進行してい(データベースのダウンロードで100GB以上のディスクスペースを使うようなのでコマンド実行時は注意)。

f:id:kazumaxneo:20210204124054p:plain

 

テストランには半日かかった。

出力

f:id:kazumaxneo:20210205113734p:plain

assemble

f:id:kazumaxneo:20210205114856p:plain


classify

f:id:kazumaxneo:20210205114905p:plain
classify_step_summary.csv

f:id:kazumaxneo:20210205114614p:plain

 

annotate

f:id:kazumaxneo:20210205114925p:plain
MUFFIN_sample_result.html

f:id:kazumaxneo:20210205114705p:plain

 

実際にfastqを指定する時は--ontと--illuminaフラグを立て、fastqのディレクトリを指定する。アセンブラはmetaspadesとmetaflyeから選ぶ。

nextflow run RVanDamme/MUFFIN --output result --ont nanopore/ --illumina illumina/ --assembler metaspades --rna rna/ -profile local,docker --modular full

fastqは解凍し、イルミナはxxx_R1.fastqとxxx_R2.fastq、ONTはxxx.fastqのファイル命名則に従う必要がある。

 

引用

Metagenomics workflow for hybrid assembly, differential coverage binning, transcriptomics and pathway analysis (MUFFIN)
Renaud Van Damme, Martin Hölzer,Adrian Viehweger,Bettina Müller, Erik Bongcam-Rudloff, Christian Brandt

BioRxiv, Posted February 08, 2020

 

2021 2/11

Metagenomics workflow for hybrid assembly, differential coverage binning, metatranscriptomics and pathway analysis (MUFFIN)
Renaud Van Damme , Martin Hölzer, Adrian Viehweger, Bettina Müller, Erik Bongcam-Rudloff

PLOS Computational Biology, Published: February 9, 2021

(2/11現在は原稿のページ校正が反映されていない早期版)

 

関連