macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

抗生物質耐性遺伝子や病原性遺伝子を素早く検索する ABRicate

2019 3/1 コマンド及びランの流れ更新

2019 3/3 リンク修正

2019 3/14 condaインストール追記

2019 4/12 dockerリンク追加

 

 ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。webツールは混雑していると実行するまで何時間も待たされることがあるが、本ツールはコマンドラインで実行し、素早く結果を得ることができる。複数のデータベースに対応している。データベースは、2コマンド打つだけで最新版に更新することもできる。

 

以下のデータベースを使用してAMR genesなどを検出できる。さらにオリジナルデータベースを追加することもできる。

 

 

ABRicateに関するツイート

 

インストール

ubuntu14.04のminiconda3.4.0.5環境でテストした。

本体 Github

#bioconda
conda install -c bioconda -y abricate

#homebrew
brew tap brewsci/science #tapしてない人だけ
brew tap brewsci/bio #tapしてない人だけ
brew install abricate

データベースもダウンロードされる。 

> abricate -h

Synopsis:

Find and collate amplicons in assembled contigs

Author:

Torsten Seemann <torsten.seemann@gmail.com>

Usage:

% abricate --list

% abricate [options] <contigs.{fasta,gbk,embl}[.gz]> > out.tab

% abricate --summary <out1.tab> <out2.tab> <out3.tab> ... > summary.tab

Options:

--help          This help.

--debug         Verbose debug output (default '0').

--quiet         Quiet mode, no stderr output (default '0').

--version       Print version and exit.

--setupdb       Format all the BLAST databases (default '0').

--list          List included databases (default '0').

--check         Check dependencies are installed (default '0').

--summary       Summarize multiple reports into a table (default '0').

--datadir [X]   Location of database folders (default '/home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/../db').

--db [X]        Database to use (default 'resfinder').

--noheader      Suppress column header row (default '0').

--csv           Output CSV instead of TSV (default '0').

--minid [n.n]   Minimum DNA %identity (default '75').

--mincov [n.n]  Minimum DNA %coverage (default '0').

--nopath        Strip filename paths from FILE column (default '0').

Documentation:

https://github.com/tseemann/abricate

依存ツールのチェック。

> abricate --check

$ abricate --check

Checking dependencies are installed:

Found 'blastn' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/blastn

Found 'makeblastdb' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/makeblastdb

Found 'blastdbcmd' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/blastdbcmd

Found 'seqret' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/seqret

Found 'gzip' => /bin/gzip

Found 'unzip' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/unzip

O.K

> abricate --list

$ abricate --list

DATABASE SEQUENCES DATE

argannot 1749 2018-Jul-16

card 2220 2018-Jul-16

ecoh 597 2018-Jul-16

ncbi 4324 2018-Jul-16

plasmidfinder 263 2018-Jul-16

resfinder 2280 2018-Jul-16

vfdb 2597 2018-Jul-16

 

追加

dockerイメージ

https://hub.docker.com/r/staphb/abricate/

 

ラン

fastaとデータベースを指定して実行する。はじめにEMBOSSのseqretコマンド( 紹介)でfastaに変換するため、fastaが多少おかしくても修復し、正常にランできるようになっている。

abricate --db resfinder input.fa > output #書き出さずターミナルにSTDOUTしてもいいかも
  • --db         Database to use (default 'resfinder').
  • --minid    Minimum DNA %identity (default '75').
  • --csv       Output CSV instead of TSV (default '0').
  • --datadir   Location of database folders (default '/usr/local/Cellar/abricate/0.8/libexec/bin/../db').

ワイルドカードを使うことで複数のfastaの同時解析も可能。genebankファイルも使用できる。ただしfastqは使えない。

出力の説明

f:id:kazumaxneo:20180703113316p:plain

 Githubより転載。

 

他のデータベースに切り替える。 abricate --listコマンドでデータベースをチェック。

DATABASE SEQUENCES DATE

argannot 1749 2018-Jul-3

card 2220 2018-Jul-3

ecoh 597 2018-Jul-3

ncbi 4324 2018-Jul-3

plasmidfinder 263 2018-Jul-3

resfinder 2280 2018-Jul-3

vfdb 2597 2018-Jul-3

例えばcardを使う。

abricate --db card input.fa

 

 複数解析結果の統合。 解析結果2つを統合する。

abricate 1.fna > 1.tab
abricate 2.fna > 2.tab

abricate --summary 1.tab 2.tab
  • --summary   Summarize multiple reports into a table (default '0').
     

データベースの最新版への更新。例えばresfinderを更新する流れは以下のようになる。

abricate-get_db --db resfinder --force
abricate-get_db --db resfinder

自分専用のデータベースも追加できます。詳細はGithubで確認してください。

 

 

追記

全部ランし、matrixファイル出力する。

#変数定義
CONTIG=assembly.fa

abricate --db card $CONTIG > card_out
abricate --db argannot $CONTIG > argannot_out
abricate --db ncbi $CONTIG > ncbi_out
abricate --db resfinder $CONTIG > resfinder_out
abricate --db vfdb $CONTIG > vfdb_out
abricate --db plasmidfinder $CONTIG > plasmidfinder_out
abricate --db ecoh $CONTIG > ecoh_out

abricate --summary card_out argannot_out ncbi_out resfinder_out vfdb_out plasmidfinder_out ecoh_out > summary 

引用

https://github.com/tseemann/abricate

 

こちらも合わせて使ってみて下さい。まとめのレポートも出ます。