macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

抗生物質耐性遺伝子や病原性遺伝子を素早く検索する ABRicate

2019 3/1 コマンド及びランの流れ更新

2019 3/3 リンク修正

2019 3/14 condaインストール追記

2019 4/12 dockerリンク追加

2019 9/27 コメント追加

2020 4/25 追記

 

 ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。webツールは混雑していると実行するまで何時間も待たされることがあるが、本ツールはコマンドラインで実行し、素早く結果を得ることができる。複数のデータベースに対応している。データベースは、2コマンド打つだけで最新版に更新することもできる。

 

以下のデータベースを使用してAMR genesなどを検出できる。さらにオリジナルデータベースを追加することもできる。

 

 

インストール

ubuntu14.04のminiconda3.4.0.5環境でテストした。

本体 Github

#bioconda
conda install -c bioconda -y abricate

#homebrew
brew tap brewsci/science #tapしてない人だけ
brew tap brewsci/bio #tapしてない人だけ
brew install abricate

データベースもダウンロードされる。 

> abricate -h

Synopsis:

Find and collate amplicons in assembled contigs

Author:

Torsten Seemann <torsten.seemann@gmail.com>

Usage:

% abricate --list

% abricate [options] <contigs.{fasta,gbk,embl}[.gz]> > out.tab

% abricate --summary <out1.tab> <out2.tab> <out3.tab> ... > summary.tab

Options:

--help          This help.

--debug         Verbose debug output (default '0').

--quiet         Quiet mode, no stderr output (default '0').

--version       Print version and exit.

--setupdb       Format all the BLAST databases (default '0').

--list          List included databases (default '0').

--check         Check dependencies are installed (default '0').

--summary       Summarize multiple reports into a table (default '0').

--datadir [X]   Location of database folders (default '/home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/../db').

--db [X]        Database to use (default 'resfinder').

--noheader      Suppress column header row (default '0').

--csv           Output CSV instead of TSV (default '0').

--minid [n.n]   Minimum DNA %identity (default '75').

--mincov [n.n]  Minimum DNA %coverage (default '0').

--nopath        Strip filename paths from FILE column (default '0').

Documentation:

https://github.com/tseemann/abricate

依存ツールのチェック。

> abricate --check

$ abricate --check

Checking dependencies are installed:

Found 'blastn' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/blastn

Found 'makeblastdb' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/makeblastdb

Found 'blastdbcmd' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/blastdbcmd

Found 'seqret' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/seqret

Found 'gzip' => /bin/gzip

Found 'unzip' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/unzip

O.K

> abricate --list

$ abricate --list

DATABASE SEQUENCES DATE

argannot 1749 2018-Jul-16

card 2220 2018-Jul-16

ecoh 597 2018-Jul-16

ncbi 4324 2018-Jul-16

plasmidfinder 263 2018-Jul-16

resfinder 2280 2018-Jul-16

vfdb 2597 2018-Jul-16

 

追加

dockerイメージ

https://hub.docker.com/r/staphb/abricate/

 

ラン

fastaとデータベースを指定して実行する。はじめにEMBOSSのseqretコマンド( 紹介)でfastaに変換するため、fastaが多少おかしくても修復し、正常にランできるようになっている。

abricate --db resfinder input.fa > output #書き出さずターミナルにSTDOUTしてもいいかも
  • --db         Database to use (default 'resfinder').
  • --minid    Minimum DNA %identity (default '75').
  • --csv       Output CSV instead of TSV (default '0').
  • --datadir   Location of database folders (default '/usr/local/Cellar/abricate/0.8/libexec/bin/../db').

ワイルドカードを使うことで複数のfastaの同時解析も可能。genbankファイルも使用できる。

出力の説明

f:id:kazumaxneo:20180703113316p:plain

 Githubより転載。

 

他のデータベースに切り替える。 abricate --listコマンドでデータベースをチェック。

DATABASE SEQUENCES DATE

argannot 1749 2018-Jul-3

card 2220 2018-Jul-3

ecoh 597 2018-Jul-3

ncbi 4324 2018-Jul-3

plasmidfinder 263 2018-Jul-3

resfinder 2280 2018-Jul-3

vfdb 2597 2018-Jul-3

defaultはNCBIのデータベースを使うが、--dbで指定すればデータベースを切り替えられる。例えばcardを使う。

abricate --db card input.fa

 

 複数解析結果の統合。 解析結果2つを統合する。

abricate 1.fna > 1.tab
abricate 2.fna > 2.tab

abricate --summary 1.tab 2.tab
  • --summary   Summarize multiple reports into a table (default '0').
     

データベースの最新版への更新。例えばresfinderを更新する流れは以下のようになる。

abricate-get_db --db resfinder --force
abricate-get_db --db resfinder

自分専用のデータベースも追加できます。詳細はGithubで確認してください。

 

 

追記

全部ランし、matrixファイル出力する。

#変数定義
CONTIG=assembly.fa

abricate --db card $CONTIG > card_out
abricate --db argannot $CONTIG > argannot_out
abricate --db ncbi $CONTIG > ncbi_out
abricate --db resfinder $CONTIG > resfinder_out
abricate --db vfdb $CONTIG > vfdb_out
abricate --db plasmidfinder $CONTIG > plasmidfinder_out
abricate --db ecoh $CONTIG > ecoh_out

abricate --summary card_out argannot_out ncbi_out resfinder_out vfdb_out plasmidfinder_out ecoh_out > summary 

#または特定のデータベースのみ調べ、サマリーを出力
abricate --db resfinder binned*fasta > resfinder_out
abricate --summary resfinder_out > summary

 

proteinレベルで調べていないので、データベースから遠い耐性遺伝子は検出できないことに注意してください(DNA homologyの閾値を変えるには-minidを使う)。

 

2020  4/25 追記

利用可能なデータベースが増えています。

f:id:kazumaxneo:20200425164308p:plain

引用

https://github.com/tseemann/abricate

 

こちらも合わせて使ってみて下さい。まとめのレポートも出ます。