macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

バクテリア、ウィルス、アーキアのアノテーションツール; Prokka

 

Prokkaは、バクテリアアーキア、ウィルスのアノテーションツール。はじめにblast+でcore geneを特定し、それからHMMER3を使ってより精度の高い分析が行われる。

 

インストールはbrewで簡単にできる。公式サイトに従い、まずperlのモジュールをインストールする。

sudo cpan Time::Piece XML::Simple Digest::MD5 Bio::Perl

 brewでインストール。

brew install prokka

 

できない場合、gitで最新版をダウンロードする方法が推奨されている (tarballもあるが古いらしい)。

git clone https://github.com/tseemann/prokka.git 
cd prokka/ #ダウンロードしたprokka/に移動
bin/prokka --setupdb #Index the sequence databasesをする

 

あとはprokka/binにパスを通しておく。

アセブルして作ったscaffodls.fastaアノテーションするなら、以下のように打つ。

prokka scaffolds.fasta

しばらくすると、PROKKA_$date/ディレクトリの中にgtf、gff、faa、fnn、genebank形式のファイルなどができる。

2回目以降のランでエラーになるときは、当日のprokka出力ディレクトリを消す。

 

データバンクに登録するためのオプションや、Genus特異的に調べるオプションもある。またローカルにすでにたくさんのgenebankファイルを持っている人なら、それをデータベースにして、よりカスタム性の高いアノテーション解析を行うことも可能である。詳細は公式マニュアルを確認してください(リクエストがあれば調べます)。

 

 

出来上がったgenebankファイルを使い、近縁種のゲノムと比較を行うなら以下の記事を参考にしてください。

1、ACTを使い、ゲノムをマウスで動かして見ていくやり方。

 

他のバクテリアと自動で一括比較し、図を出力する。


 

 

引用------------------------------------------------------------------------------------------

Prokka: rapid prokaryotic genome annotation.

Seemann T1

Bioinformatics. 2014 Jul 15;30(14):2068-9. doi: 10.1093/bioinformatics/btu153. Epub 2014 Mar 18.