2019 3/1 コマンド及びランの流れ更新
2019 3/3 リンク修正
2019 3/14 condaインストール追記
2019 4/12 dockerリンク追加
2019 9/27 コメント追加
2020 4/25 追記
ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。webツールは混雑していると実行するまで何時間も待たされることがあるが、本ツールはコマンドラインで実行し、素早く結果を得ることができる。複数のデータベースに対応している。データベースは、2コマンド打つだけで最新版に更新することもできる。
以下のデータベースを使用してAMR genesなどを検出できる。さらにオリジナルデータベースを追加することもできる。
- Resfinder( PointFinder紹介)
- ARG-ANNOT
- CARD
- NCBI Bacterial Antimicrobial Resistance Reference Gene Database
- EcOH
- PlasmidFinder (紹介)
- VFDB
- Ecoli_VF
インストール
ubuntu14.04のminiconda3.4.0.5環境でテストした。
本体 Github
#bioconda
conda install -c bioconda -y abricate
#homebrew
brew tap brewsci/science #tapしてない人だけ
brew tap brewsci/bio #tapしてない人だけ
brew install abricate
データベースもダウンロードされる。
> abricate -h
Synopsis:
Find and collate amplicons in assembled contigs
Author:
Torsten Seemann <torsten.seemann@gmail.com>
Usage:
% abricate --list
% abricate [options] <contigs.{fasta,gbk,embl}[.gz]> > out.tab
% abricate --summary <out1.tab> <out2.tab> <out3.tab> ... > summary.tab
Options:
--help This help.
--debug Verbose debug output (default '0').
--quiet Quiet mode, no stderr output (default '0').
--version Print version and exit.
--setupdb Format all the BLAST databases (default '0').
--list List included databases (default '0').
--check Check dependencies are installed (default '0').
--summary Summarize multiple reports into a table (default '0').
--datadir [X] Location of database folders (default '/home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/../db').
--db [X] Database to use (default 'resfinder').
--noheader Suppress column header row (default '0').
--csv Output CSV instead of TSV (default '0').
--minid [n.n] Minimum DNA %identity (default '75').
--mincov [n.n] Minimum DNA %coverage (default '0').
--nopath Strip filename paths from FILE column (default '0').
Documentation:
https://github.com/tseemann/abricate
依存ツールのチェック。
> abricate --check
$ abricate --check
Checking dependencies are installed:
Found 'blastn' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/blastn
Found 'makeblastdb' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/makeblastdb
Found 'blastdbcmd' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/blastdbcmd
Found 'seqret' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/seqret
Found 'unzip' => /home/kazu/.pyenv/versions/miniconda3-4.0.5/bin/unzip
O.K
> abricate --list
$ abricate --list
DATABASE SEQUENCES DATE
argannot 1749 2018-Jul-16
card 2220 2018-Jul-16
ecoh 597 2018-Jul-16
ncbi 4324 2018-Jul-16
plasmidfinder 263 2018-Jul-16
resfinder 2280 2018-Jul-16
vfdb 2597 2018-Jul-16
追加
dockerイメージ
https://hub.docker.com/r/staphb/abricate/
ラン
fastaとデータベースを指定して実行する。はじめにEMBOSSのseqretコマンド( 紹介)でfastaに変換するため、fastaが多少おかしくても修復し、正常にランできるようになっている。
abricate --db resfinder input.fa > output #書き出さずターミナルにSTDOUTしてもいいかも
- --db Database to use (default 'resfinder').
- --minid Minimum DNA %identity (default '75').
- --csv Output CSV instead of TSV (default '0').
- --datadir Location of database folders (default '/usr/local/Cellar/abricate/0.8/libexec/bin/../db').
ワイルドカードを使うことで複数のfastaの同時解析も可能。genbankファイルも使用できる。
出力の説明
Githubより転載。
他のデータベースに切り替える。 abricate --listコマンドでデータベースをチェック。
DATABASE SEQUENCES DATE
argannot 1749 2018-Jul-3
card 2220 2018-Jul-3
ecoh 597 2018-Jul-3
ncbi 4324 2018-Jul-3
plasmidfinder 263 2018-Jul-3
resfinder 2280 2018-Jul-3
vfdb 2597 2018-Jul-3
defaultはNCBIのデータベースを使うが、--dbで指定すればデータベースを切り替えられる。例えばcardを使う。
abricate --db card input.fa
複数解析結果の統合。 解析結果2つを統合する。
abricate 1.fna > 1.tab
abricate 2.fna > 2.tab
abricate --summary 1.tab 2.tab
- --summary Summarize multiple reports into a table (default '0').
データベースの最新版への更新。例えばresfinderを更新する流れは以下のようになる。
abricate-get_db --db resfinder --force
abricate-get_db --db resfinder
自分専用のデータベースも追加できます。詳細はGithubで確認してください。
追記
全部ランし、matrixファイル出力する。
#変数定義
CONTIG=assembly.fa
abricate --db card $CONTIG > card_out
abricate --db argannot $CONTIG > argannot_out
abricate --db ncbi $CONTIG > ncbi_out
abricate --db resfinder $CONTIG > resfinder_out
abricate --db vfdb $CONTIG > vfdb_out
abricate --db plasmidfinder $CONTIG > plasmidfinder_out
abricate --db ecoh $CONTIG > ecoh_out
abricate --summary card_out argannot_out ncbi_out resfinder_out vfdb_out plasmidfinder_out ecoh_out > summary
#または特定のデータベースのみ調べ、サマリーを出力
abricate --db resfinder binned*fasta > resfinder_out
abricate --summary resfinder_out > summary
proteinレベルで調べていないので、データベースから遠い耐性遺伝子は検出できないことに注意してください(DNA homologyの閾値を変えるには-minidを使う)。
2020 4/25 追記
利用可能なデータベースが増えています。
引用
https://github.com/tseemann/abricate
こちらも合わせて使ってみて下さい。まとめのレポートも出ます。