macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

抗生物質耐性遺伝子や病原性遺伝子を素早く検索できる ABRicate

 

 ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。webツールは混雑していると実行するまで何時間も待たされることがあるが、本ツールはコマンドラインで実行し、素早く結果を得ることができる。複数のデータベースに対応している。データベースは、2コマンド打つだけで最新版に更新することもできる。

 

以下のデータベースを使用できる。さらにオリジナルデータベースを追加することもできる。

 

ABRicateに関するツイート

 

インストール

mac os 10.12にbrewを使って導入した。

本体 Github

brew tap brewsci/science  #tapしてない人だけ
brew tap brewsci/bio #tapしてない人だけ
brew install abricate

#Anaconda環境ならcondaを使う。(Biocondaのチャネルを最上位にしてあるなら)
conda install abricate

データベースもダウンロードされる。 

> abricate -h

$ abricate -h

Synopsis:

Find and collate amplicons in assembled contigs

Author:

Torsten Seemann <torsten.seemann@gmail.com>

Usage:

% abricate --list

% abricate [options] <contigs.{fasta,gbk,embl}[.gz]> > out.tab

% abricate --summary <out1.tab> <out2.tab> <out3.tab> ... > summary.tab

Options:

--help          This help.

--debug         Verbose debug output (default '0').

--quiet         Quiet mode, no stderr output (default '0').

--version       Print version and exit.

--setupdb       Format all the BLAST databases (default '0').

--list          List included databases (default '0').

--check         Check dependencies are installed (default '0').

--summary       Summarize multiple reports into a table (default '0').

--datadir [X]   Location of database folders (default '/usr/local/Cellar/abricate/0.8/libexec/bin/../db').

--db [X]        Database to use (default 'resfinder').

--noheader      Suppress column header row (default '0').

--csv           Output CSV instead of TSV (default '0').

--minid [n.n]   Minimum DNA %identity (default '75').

--mincov [n.n]  Minimum DNA %coverage (default '0').

--nopath        Strip filename paths from FILE column (default '0').

Documentation:

https://github.com/tseemann/abricate

依存ツールのチェック。

> abricate --check

Checking dependencies are installed:

Found 'blastn' => /usr/local/bin/blastn

Found 'makeblastdb' => /usr/local/bin/makeblastdb

Found 'blastdbcmd' => /usr/local/bin/blastdbcmd

Found 'seqret' => /usr/local/bin/seqret

Found 'gzip' => /usr/bin/gzip

Found 'unzip' => /usr/bin/unzip

OK.

ダウンロード済みデータベースの照会。

> abricate --list

DATABASE SEQUENCES DATE

argannot 1749 2018-Jul-3

card 2220 2018-Jul-3

ecoh 597 2018-Jul-3

ncbi 4324 2018-Jul-3

plasmidfinder 263 2018-Jul-3

resfinder 2280 2018-Jul-3

vfdb 2597 2018-Jul-3

 

ラン

fastaとデータベースを指定して実行する。はじめにEMBOSSのseqretコマンド( 紹介)でfastaに変換するため、fastaが多少おかしくても修復し、正常にランできるようになっている。

abricate --db resfinder input.fa > output #書き出さずターミナルにSTDOUTしてもいいかも
  • --db         Database to use (default 'resfinder').
  • --minid    Minimum DNA %identity (default '75').
  • --csv       Output CSV instead of TSV (default '0').
  • --datadir   Location of database folders (default '/usr/local/Cellar/abricate/0.8/libexec/bin/../db').

ワイルドカードを使うことで複数のfastaの同時解析も可能。genebankファイルも使用できる。ただしfastqは使えない。

出力の説明

f:id:kazumaxneo:20180703113316p:plain

 Githubより転載。

 

他のデータベースに切り替える。 abricate --listコマンドでデータベースをチェック。

DATABASE SEQUENCES DATE

argannot 1749 2018-Jul-3

card 2220 2018-Jul-3

ecoh 597 2018-Jul-3

ncbi 4324 2018-Jul-3

plasmidfinder 263 2018-Jul-3

resfinder 2280 2018-Jul-3

vfdb 2597 2018-Jul-3

例えばcardを使う。

abricate --db card input.fa

 

 複数解析結果の統合。 解析結果2つを統合する。

abricate 1.fna > 1.tab
abricate 2.fna > 2.tab

abricate --summary 1.tab 2.tab
  • --summary   Summarize multiple reports into a table (default '0').
     

データベースの最新版への更新。例えばresfinderを更新する流れは以下のようになる。

abricate-get_db --db resfinder --force
abricate-get_db --db resfinder

自分専用のデータベースも追加できます。詳細はGithubで確認してください。

 

引用

https://github.com/tseemann/abricate