2022/09/07 誤字修正、オプション追記, 10/17 インストール手順修正
2022/12/18 論文引用
2024/02/05 追記
本発表では、33,000 以上の種レベルのOTUについてメタゲノムのプロファイリングを可能にするコマンドラインツール、mOTUs3 を紹介する。そのために、土壌、淡水、反芻動物やその他の動物の消化管など、多様なマイクロバイオームから得られた60万以上のドラフトゲノム(そのほとんどがメタゲノムアセンブリゲノム(MAG))の再構成と解析を活用し、リファレンスゲノムに大きく劣ることを明らかにした。全体として、全種レベルの分類群の3分の2がリファレンスゲノムを欠いていた。これらの新規分類群の累積相対存在量は、ヒトの体内部位のようなよく研究されているマイクロバイオームでは低かった(6-11%)。一方、ヒト以外の多様なマイクロバイオームでは、相対存在量のかなりの割合(海洋、淡水、土壌:43-63%)、あるいは大部分(豚、魚、牛:60-80%)を占めた。コミュニティが開発したベンチマークとデータセットを用いて、mOTUs3が他の手法よりも正確で、16S rRNA遺伝子ベースの分類学的プロファイリング手法と一致することを確認した。さらに、mOTUs3は、よく知られた微生物群を種レベルの分類群に分解する能力を大幅に高め、比較メタゲノム研究において、異なる濃度で存在する新しい分類群を同定するのに役立つことを実証した。
メタゲノムの正確な種レベルのプロファイリングを可能にするためにmOTUs3を開発した。他の手法と比較して、原核生物群集の多様性、特に現在未解明なマイクロバイオームについて、より包括的な見解を得ることができる。研究コミュニティによる比較解析を容易にするため、一般に公開されているメタゲノムについて11,000以上の事前計算されたプロファイルが公開されており、https://github.com/motu-tool/mOTUs で自由に利用できる。
Come to poster 269 at #ISME18 to talk to @alessio_mila about mOTUs3. The poster session starts in half an hour! pic.twitter.com/iyVTMKF8D6
— Microbiome Research (@SunagawaLab) August 16, 2022
- Python 3 (or higher)
- the Burrow-Wheeler Aligner v0.7.15 or higher (bwa)
- SAMtools v1.5 or higher
- metaSNV v1.0.3 (necessary for snv_call command)
本体 Github
#conda (link)
mamba create -n motus python=3.8 -y
conda activate motus
mamba install -c conda-forge -c bioconda bwa samtools metasnv -y
mamba install -c conda-forge -c bioconda motus=3.0.3
#pip (pypi)
pip install motu-profiler
motus downloadDB
motus profile --test
> motus profile --test
> motus profile
Usage: motus profile [options]
Input options:
-f FILE[,FILE] input file(s) for reads in forward orientation, fastq(.gz)-formatted
-r FILE[,FILE] input file(s) for reads in reverse orientation, fastq(.gz)-formatted
-s FILE[,FILE] input file(s) for unpaired reads, fastq(.gz)-formatted
-n STR sample name ['unnamed sample']
-i FILE[,FILE] provide SAM or BAM input file(s) (generated by motus map_tax)
-m FILE provide a mgc reads count file (generated by motus calc_mgc)
-db DIR provide a different database directory
Output options:
-o FILE output file name [stdout]
-I FILE save the result of BWA in BAM format (output of motus map_tax)
-M FILE save the mgc reads count (output of motus calc_mgc)
-e only species with reference genomes (ref-mOTUs)
-u print the full name of the species
-c print result as counts instead of relative abundances
-p print NCBI taxonomy identifiers
-B print result in BIOM format
-C STR print result in CAMI format (BioBoxes format 0.9.1)
Values: [precision, recall, parenthesis]
-q print the full rank taxonomy
-A print all taxonomic levels together (kingdom to mOTUs, override -k)
-k STR taxonomic level [mOTU]
Values: [kingdom, phylum, class, order, family, genus, mOTU]
Algorithm options:
-g INT number of marker genes cutoff: 1=higher recall, 6=higher precision [3]
-l INT min length of the alignment (bp) [75]
-t INT number of threads [1]
-v INT verbosity level: 1=error, 2=warning, 3=message, 4+=debugging [3]
-y STR type of read counts [insert.scaled_counts]
Values: [base.coverage, insert.raw_counts, insert.scaled_counts]
> motus merge
Usage: motus merge [options]
Input options:
-i FILE[,FILE] list of mOTU profiles to merge (comma separated)
-d DIR merge all files in the directory DIR
-a STR[,STR] add pre-computed profiles from different environmental samples
Values: [all, air, bioreactor, bee, cat,
cattle, chicken, dog, fish, freshwater, human,
marine, mouse, pig, sheep, soil, termite, wastewater]
Output options:
-o FILE output file name [stdout]
-B print result in BIOM format
Algorithm options:
-v INT verbosity level: 1=error, 2=warning, 3=message,
4+=debugging [3]
motus profile -s metagenomic_sample.fq.gz -t 20 -n sample1 -o taxonomy_profile_sample1.txt
motus profile -f sample_R1.fq.gz -r sample_R2.fq.gz -t 20 -n sample1 -o taxonomy_profile_sample1.txt
motus profile -f sample1_run1.fq,sample1_run2.fq -r sample1_run1_rev.fq,sample1_run2_rev.fq -s sample1_run1_single.fq -t 20 -n sample1 -o taxonomy_profile_sample1.txt
- -f input file(s) for reads in forward orientation, fastq(.gz)-formatted
- -r input file(s) for reads in reverse orientation, fastq(.gz)-formatted
- -s input file(s) for unpaired reads, fastq(.gz)-formatted
- -n sample name ['unnamed sample']
- -t number of threads [1]
- -o output file name [stdout]
motus profileコマンドは、map_tax、calc_mgc 、calc_motu コマンドで行う3つのステップで一括で行う。
motus mergeコマンドを使う。
motus profile -s metagenomic_sample_1.fastq -o taxonomy_profile_1.txt
motus profile -s metagenomic_sample_2.fastq -o taxonomy_profile_2.txt
motus merge -i taxonomy_profile_1.txt,taxonomy_profile_2.txt > all_sample_profiles.txt
motus merge -d profile_fir/ > all_sample_profiles.txt
Reference genome-independent taxonomic profiling of microbiomes with mOTUs3
Hans-Joachim Ruscheweyh, Alessio Milanese, Lucas Paoli, Nicolai Karcher, Quentin Clayssen, Marisa Isabell Metzger, Jakob Wirbel, Peer Bork, Daniel R. Mende, Georg Zeller, Shinichi Sunagawa
bioRxiv, Posted April 08, 2022
Cultivation-independent genomes greatly expand taxonomic-profiling capabilities of mOTUs across various environments
Hans-Joachim Ruscheweyh, Alessio Milanese, Lucas Paoli, Nicolai Karcher, Quentin Clayssen, Marisa Isabell Keller, Jakob Wirbel, Peer Bork, Daniel R. Mende, Georg Zeller & Shinichi Sunagawa
Microbiome volume 10, Article number: 212 (2022)