macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

graftM

gtaftMは指定した遺伝子ファミリーをメタゲノムデータから探し出し、あらかじめ作成した系統樹に配置するためのツール。

 

インストール

依存ツール

  • orfM (straightforwardなORF検出)

https://github.com/wwood/OrfM/releases

ダウンロードしてビルドする。 ./orfm -hで動作確認。パスを通す。

cd orfM/
./configure
make

 

brewで導入できる(リンク)。

 

  • fxtract(シーケンス抽出)
git clone --recursive https://github.com/ctSkennerton/fxtract.git #ファイルサイズ264MB
cd fxtract
make

 

brewで導入できる。

 

ダウンロードしてビルドする。

cd KronaTools-2.7/
sudo ./install.pl

 

  • mafft(マルチプルアライメント)

MAFFT - a multiple sequence alignment program

以前紹介した(リンク)。.pkgからインストールする。

 

  • diamond

https://github.com/bbuchfink/diamond

以前紹介した(リンク)。brewで導入できる。

 

FastTree 2.1: Approximately-Maximum-Likelihood Trees for Large Alignments

brewで導入できる。

 

 

本体

pip install graftm #python2.7

 #numpyがエラーを吐いたが、sudo -H pip uninstallでアンインストールして、sudo -H pip installで再導入したら直った。

 

実行方法

エラーを吐いたので、一旦まとめるのを中止します。

時間があれば調べます。 

 

  

引用

追記

論文が出ていました。

GraftM: a tool for scalable, phylogenetically informed classification of genes within metagenomes
Boyd JA, Woodcroft BJ, Tyson GW

Nucleic Acids Res. 2018 Jun 1;46(10):e59

 

GraftM - How to get fast community profiles from metagenomes