微生物は様々な環境の中で重要な役割を果たしている。微生物の組成を特定し、その存在量を推定することで、環境試料中の微生物の相互作用を理解することができる。微生物の環境をより深く理解するために、微生物ゲノムのメタゲノムアセンブリを用いて、環境試料中の微生物の組成を調べることが行われている。この分野では、様々なアルゴリズムに基づいた分類学解析ツールが開発されているが、同じメタゲノムデータセットからの解析結果のばらつきが、多くの研究者にとって大きな障害となっている。
本研究では、3つの異なる分類学解析ツールの出力をインテリジェントに統合することで、メタゲノム分類学解析のための新しいメタ解析ツールTAMAを提案する。TAMAは、統合されたリファレンスデータベースを用いて、異なる分類ツールからの分類スコアを統合し、メタスコアに基づいて入力されたメタゲノムリードに対して分類を行うもので、既存の分類ツールよりも優れている。TAMAは、様々なベンチマークデータセットを用いて評価した結果、既存のツールよりも優れた性能を示した。また、チーズメタゲノムとヒト腸内メタゲノムの2種類のメタゲノムにおける微生物の相対的な種数分布と組成の違いを得るために適用することにも成功した。
TAMA は簡単にインストールして利用することができる。TAMA は簡単に導入でき、複数の数や種類のメタゲノムリードサンプルからのメタゲノムリードの分類や相対的な種の豊富さの予測に利用することができる。特に、単一の分類学解析ツールでは信頼性が低い場合には、様々な環境から収集したメタゲノムサンプル中の微生物の組成をより正確に明らかにするためにTAMAを使用することができる。TAMAはオープンソースのツールで、https://github.com/jkimlab/TAMA からダウンロードできる。
インストール
docker imageをビルドしてテストした。
依存
- perl (v5.22.1)
- python (2.7.12)
- java (1.8.0)
- git (2.7.4)
- gcc, g++ (5.4.0)
- make (GNU Make 4.1)
- zip (3.0)
- curl (7.47.0)
- Sort::Key::Natural (perl library)
必要な計算リソース
Disk: (approximately) 300GB
* CLARK: 88GB, Kraken: 188GB, Centrifuge: 9.6GB
- Memory: (approximately) 185GB
* This large memory is required for running the taxonomy analysis tools,
especially CLARK and Kraken
本体 Github
git clone https://github.com/jkimlab/TAMA.git
cd TAMA
docker build -t tama .
docker run -it tama /bin/bash
cd TAMA/
[Error] There is no proper parameter file.
Usage: ./TAMA.pl [option] --param param.txt
Options:
-p The number of threads (default: 1)
-o Path of output directory (default: Current directory)
-t Save temporary files (default: False)
If you want to save, type 'True'
-h|help Print help page.
Input:
--param (Required) Path of paramter file
# Check the required perl libraries
./setup.pl --check
** Check the requirements..
ok 3.67 Cwd
ok 2.85 File::Basename
ok 1.51 FindBin
ok 2.49 Getopt::Long
ok 0.04 Sort::Key::Natural
# Install TAMA package
./setup.pl --install
テストラン
テストデータベースをダウンロードしてテストランを実行する。
./setup.pl --example
source ./src/env.sh
bash Example_run.cmd.sh
出力
データベースの準備
使用時に追記します。
引用
TAMA: Improved Metagenomic Sequence Classification Through Meta-Analysis
Mikang Sim, Jongin Lee, Daehwan Lee, Daehong Kwon , Jaebum Kim
BMC Bioinformatics. 2020 May 12;21(1):185