2021 2/5,2/6 出力例追記
2021 2/11 論文引用
メタゲノミクスは微生物学の多くの分野を再定義した。しかし、メタゲノムアセンブルゲノム(MAG)は、主にショートリードでシーケンスが行われた場合、断片化されていることが多い。最近のロングリードシーケンシング技術は、ゲノム再構成を改善することを約束している。しかし、2つの異なるシークエンシング技術を統合すると、下流の解析が複雑になる。そこで著者らは、ショートリードとロングリードを用いて高品質のビンとそのアノテーションを生成する完全なメタゲノムワークフローであるMUFFINを開発した。このワークフローは、ワークフローオーケストレーションソフトウェアであるNextflowを用いて記述されており、高い再現性と高速かつ簡単な使用を実現している。このワークフローはまた、ビンの分類学的分類とKEGGパスウェイを生成し、定量化とアノテーションのためのRNA-Seqデータ(オプション)を提供することができる。20 個のバイオガスリアクターサンプルを用いてワークフローをテストし、微生物群集とその機能を解析するために必要なファイルを処理して出力する MUFFIN の能力を評価した。MUFFINは機能パスウェイの予測を行い、提供された場合には、メタゲノムサンプルと各ビンのデノボ転写産物のアノテーションを生成する。
The Workflow. Githubより転載
公開当初は一部プロセスが開発中でランできなかったが、その後バージョンアップによって全プロセスが通しでランできるようになった(らしい)。
インストール
依存
- nextflow
- conda
本体 Github
nextflow run RVanDamme/MUFFIN --parameters
> nextflow run RVanDamme/MUFFIN --parameter -profile local,docker
$ nextflow run RVanDamme/MUFFIN --parameter -profile local,docker
N E X T F L O W ~ version 20.07.1
Launching `RVanDamme/MUFFIN` [extravagant_cuvier] - revision:
347367e00d [master]
[- ] process > sourmash_download_db -
[- ] process > sourmash_download_db [ 0%] 0 of 1
[- ] process > discard_short -
[- ] process > merge -
[- ] process > fastp -
[- ] process > spades -
[- ] process > minimap2 -
[- ] process > bwa -
[- ] process > metabat2 -
[- ] process > maxbin2 -
[- ] process > concoct -
[- ] process > refine3 -
[- ] process > checkm -
[- ] process > sourmash_bins -
[- ] process > sourmash_checkm_parser -
[- ] process > eggnog_download_db [ 0%] 0 of 1
[- ] process > eggnog_bin -
[- ] process > parser_bin -
[- ] process > readme_output [ 0%] 0 of 1
*********Start running MUFFIN*********
MUFFIN is a hybrid assembly and differential binning workflow for
metagenomics, transcriptomics and pathway analysis.
If you use MUFFIN for your research pleace cite:
https://www.biorxiv.org/content/10.1101/2020.02.08.939843v1
or
Van Damme R., Hölzer M., Viehweger A., Müller B., Bongcam-Rudloff E.,
Brandt C., 2020
"Metagenomics workflow for hybrid assembly, differential coverage
binning, transcriptomics and pathway analysis (MUFFIN)",
doi: https://doi.org/10.1101/2020.02.08.939843
**************************************
No files match pattern `*_R{1,2}.fastq{,.gz}` at path: ./illumina/
No files match pattern `*.fastq{,.gz}` at path: ./nanopore/
テストラン
#test locally with conda
nextflow run RVanDamme/MUFFIN --output results_dir --cpus 8 --memory 32g -profile local,conda,test
#test locally with docker (docker実行権限がユーザに無いならsudo実行)
nextflow run RVanDamme/MUFFIN --output results_dir --rna -profile local,docker,test
実行するとdockerイメージのダウンロードやcondaの環境が作られ、ジョブが進行してい(データベースのダウンロードで100GB以上のディスクスペースを使うようなのでコマンド実行時は注意)。
テストランには半日かかった。
出力
assemble
classify
classify_step_summary.csv
annotate
MUFFIN_sample_result.html
実際にfastqを指定する時は--ontと--illuminaフラグを立て、fastqのディレクトリを指定する。アセンブラはmetaspadesとmetaflyeから選ぶ。
nextflow run RVanDamme/MUFFIN --output result --ont nanopore/ --illumina illumina/ --assembler metaspades --rna rna/ -profile local,docker --modular full
fastqは解凍し、イルミナはxxx_R1.fastqとxxx_R2.fastq、ONTはxxx.fastqのファイル命名則に従う必要がある。
引用
Metagenomics workflow for hybrid assembly, differential coverage binning, transcriptomics and pathway analysis (MUFFIN)
Renaud Van Damme, Martin Hölzer,Adrian Viehweger,Bettina Müller, Erik Bongcam-Rudloff, Christian Brandt
BioRxiv, Posted February 08, 2020
2021 2/11
Metagenomics workflow for hybrid assembly, differential coverage binning, metatranscriptomics and pathway analysis (MUFFIN)
Renaud Van Damme , Martin Hölzer, Adrian Viehweger, Bettina Müller, Erik Bongcam-Rudloff
PLOS Computational Biology, Published: February 9, 2021
(2/11現在は原稿のページ校正が反映されていない早期版)
関連