macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

TAMA

 

微生物は様々な環境の中で重要な役割を果たしている。微生物の組成を特定し、その存在量を推定することで、環境試料中の微生物の相互作用を理解することができる。微生物の環境をより深く理解するために、微生物ゲノムのメタゲノムアセンブリを用いて、環境試料中の微生物の組成を調べることが行われている。この分野では、様々なアルゴリズムに基づいた分類学解析ツールが開発されているが、同じメタゲノムデータセットからの解析結果のばらつきが、多くの研究者にとって大きな障害となっている。

 本研究では、3つの異なる分類学解析ツールの出力をインテリジェントに統合することで、メタゲノム分類学解析のための新しいメタ解析ツールTAMAを提案する。TAMAは、統合されたリファレンスデータベースを用いて、異なる分類ツールからの分類スコアを統合し、メタスコアに基づいて入力されたメタゲノムリードに対して分類を行うもので、既存の分類ツールよりも優れている。TAMAは、様々なベンチマークデータセットを用いて評価した結果、既存のツールよりも優れた性能を示した。また、チーズメタゲノムとヒト腸内メタゲノムの2種類のメタゲノムにおける微生物の相対的な種数分布と組成の違いを得るために適用することにも成功した。

 TAMA は簡単にインストールして利用することができる。TAMA は簡単に導入でき、複数の数や種類のメタゲノムリードサンプルからのメタゲノムリードの分類や相対的な種の豊富さの予測に利用することができる。特に、単一の分類学解析ツールでは信頼性が低い場合には、様々な環境から収集したメタゲノムサンプル中の微生物の組成をより正確に明らかにするためにTAMAを使用することができる。TAMAオープンソースのツールで、https://github.com/jkimlab/TAMA からダウンロードできる。

 

 

インストール

docker imageをビルドしてテストした。

依存

  • perl (v5.22.1)
  • python (2.7.12)
  • java (1.8.0)
  • git (2.7.4)
  • gcc, g++ (5.4.0)
  • make (GNU Make 4.1)
  • zip (3.0)
  • curl (7.47.0)
  • Sort::Key::Natural (perl library)

必要な計算リソース

Disk: (approximately) 300GB
* CLARK: 88GB, Kraken: 188GB, Centrifuge: 9.6GB
- Memory: (approximately) 185GB
* This large memory is required for running the taxonomy analysis tools,
especially CLARK and Kraken

本体 Github

git clone https://github.com/jkimlab/TAMA.git
cd TAMA
docker build -t tama .
docker run -it tama /bin/bash
cd TAMA/

perl TAMA.pl -h

# perl TAMA.pl -h

[Error] There is no proper parameter file.

Usage: ./TAMA.pl [option] --param param.txt 

Options:

-p The number of threads  (default: 1)

-o Path of output directory  (default: Current directory)

-t Save temporary files (default: False)

If you want to save, type 'True'

-h|help Print help page.

Input:

--param (Required) Path of paramter file

# Check the required perl libraries

./setup.pl --check

** Check the requirements..

ok       3.67 Cwd

ok       2.85 File::Basename

ok       1.51 FindBin

ok       2.49 Getopt::Long

ok       0.04 Sort::Key::Natural

 

# Install TAMA package

./setup.pl --install

 

テストラン

テストデータベースをダウンロードしてテストランを実行する。

./setup.pl --example
source ./src/env.sh
bash Example_run.cmd.sh

出力

f:id:kazumaxneo:20200617084734p:plain

f:id:kazumaxneo:20200617084740p:plain

 

データベースの準備

使用時に追記します。

  

引用

TAMA: Improved Metagenomic Sequence Classification Through Meta-Analysis

Mikang Sim, Jongin Lee, Daehwan Lee, Daehong Kwon , Jaebum Kim

BMC Bioinformatics. 2020 May 12;21(1):185