macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

メタゲノム内の遺伝子を系統樹的に分類するためのスケーラブルなツール GraftM

2022/05/04 インストール手順修正

 

gtaftMは指定した遺伝子ファミリーをメタゲノムデータから探し出し、あらかじめ作成した系統樹に配置するためのツール。

 

HP

GraftM - How to get fast community profiles from metagenomes

manual

https://github.com/geronimp/graftM/wiki

 

インストール

condaとpipで導入できるが、次の依存ツールは別に導入されていなければならない。

依存

  • OrfM v. >= 0.2.0
  • HMMer v. >= 3.1b1
  • fxtract
  • pplacer v. >= 2.6.32
  • Krona v. >= 2.4
  • MAFFT v. >= 7.22
  • DIAMOND v. >= 0.7.9

Gihtub

#conda(link)
mamba create -n graftm -y
conda activate graftm
mamba install -c bioconda graftm -y

#pip
pip install graftm #python2.7

> graftM 

                                  GraftM  0.13.1

 

                            Joel Boyd, Ben Woodcroft

 

    GraftM is a tool for rapid, phylogenetically informed gene-centric

    analysis of sequence data. The main 'graft' pipeline identifies short read

    sequences with homology to genes of interest (16S rRNA or protein coding)

    using Hidden Markov Models (HMMs), which are then placed into a

    phylogenetic tree. The classification of sequences is inferred by their

    placement relative to annotated reference sequences in the tree. For

    protein coding genes, a 'best BLAST hit' style analysis can also be used.

 

    A manuscript describing and benchmarking the tool is in preparation:

 

    Boyd, J., Woodcroft B., Tyson, G. "GraftM: A tool for scalable,

    phylogenetically informed classification of genes within metagenomes (in

    preparation).

 

  -----------------------------------------------------------------------------

 

  Community profiling

    graft         ->  Identify and phylogenetically classify sequences

                      belonging to a gene family in a metagenome.

    expand_search ->  Create a sample-specific HMM from an assembly or genome

                      set.

 

  Gpkg creation

    create        ->  Create a gene family specific graftm package (gpkg).

    update        ->  Update an existing graftm packages with new sequences.

 

  Utilities

    tree          ->  Decorate or reroot phylogenetic trees for graft packages.

    archive       ->  Compress or decompress a graftm package.

 

 

実行方法

入力配列データは、fasta (.fa) または fastqで、gzip (.fq.gz) にも対応している。タンパク質またはヌクレオチド配列が利用可能。スペースでファイルを区切るだけで、1回の実行で複数のデータセットを使用することができる。 GraftM データベース(リファレンス、HMMなどのデータベース)のパスを指定する必要がある。

GraftM graft --forward reads1.fa reads2.fa --graftM_package mcrA.gpkg 

 

 

  

引用

追記

GraftM: a tool for scalable, phylogenetically informed classification of genes within metagenomes
Boyd JA, Woodcroft BJ, Tyson GW

Nucleic Acids Res. 2018 Jun 1;46(10):e59

 

GraftM - How to get fast community profiles from metagenomes