macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノム比較ビューア Artemis comparison tool (ACT)

 

ACTは2つ以上のゲノムを比較して、塩基配列同一性の高い領域を描画するツールである。3つ以上のゲノムを同時に比較することも可能で、汎用性は高い。解析に必要なのは比較する生物種ごとのfastaファイルと遺伝子のアノテーションファイル(genebankフォーマットなど)である。ACTは予めblast検索を行っておき、それからjavaのプログラムを立ち上げる。そのため、ACTを起動する前に、blastサーバーにアクセスして総当たりblastするか、ローカルblastコマンドで総当たりのblast検索を行う必要がある(具体的にはローカルブラストを -outfmt 6をつけて実行し、タブ形式の結果ファイルを出力する)。

 下記ではblastサーバーを利用したやり方を書いていく。 

 

手順 

1、blastサーバーを使ったblast解析

ACTの解析専用に、クラウドでブラスト解析を行ってくれるサーバーが下記URLである。

http://www.hpa-bioinfotools.org.uk/pise/double_actv2.html

f:id:kazumaxneo:20170614163819j:plain

top画面

 

2つある大きなウィンドウに比較するゲノムのfasta形式のファイルを2つ入れる。テストなら、OR select buttonを押して生物種を選ぶ。下の方のblastnかblastpを選び、メールアドレスを記入してRun_genome_blastボタンを押せば解析が始まる。blastは精度より速度重視の手法のため、プラスミドのような小さいゲノムだと瞬時に終わり下の画面になる。

 

f:id:kazumaxneo:20170324171719j:plain

ブラスト終了後の画面

 

上のgenome_blast.result を右クリックして "リンク先のファイルをダウンロード"でダウンロードする。次にACTのダウンロードを行う。

 

 

2、ACTのインストール と起動

http://www.sanger.ac.uk/science/tools/artemis-comparison-tool-actにアクセスする。

f:id:kazumaxneo:20170614164345j:plain

 

上の画面中央付近の"Mac OS"をクリックしてダウンロードする。自己解凍されてできた4つのアプリをApplications/にコピーする。これでインストールは完了。

 

 

ただし最新のmac OSだと起動できない。起動できない人は、上のリンクから、java web start版をダウンロードする。 ダウンロードしたアイコンを叩くと起動するが、mac OS sierraではApp store以外から落としたファイルを起動できない。 怒られたら、リンゴマークから環境設定を起動し、セキュリティとプライバシの項目のこのまま開くをクリック、を選択する。   

 

f:id:kazumaxneo:20170324171808j:plain

 

パスを入れて起動する。それでも怒られる場合、jabaのセキュリティに例外URLを登録する必要がある。リンゴマーク -> 環境設定 -> javaを選択。

f:id:kazumaxneo:20170324171838j:plain

 

java-> セキュリティタブをクリック。サイトリストの編集をクリック

f:id:kazumaxneo:20170324172442j:plain

http://www.genedb.org を追加して保存。もう一度ダウンロードしたファイルを叩くと、また文句を言われるが起動できるようになる。

 

3、gbkファイルの読み込み

起動したら、File -> Open ...を選択。

f:id:kazumaxneo:20170324171924j:plain

 

下のウィンドウが出てくるので、ブラスト解析に使ったデータのgenebankファイル2つを選ぶ。comparison fileにはブラスト解析でダウンロードしたテキストファイルを選択。

f:id:kazumaxneo:20170324172020j:plain

ゲノムが似たもの同士を比較すると、初期条件ではこのように蜘蛛の巣を張ったような感じになる。

f:id:kazumaxneo:20170324172043j:plain

 

 

閾値を上げて完全マッチだけ取り出す。画面で右クリックしてSet Score Cutoffを選択

f:id:kazumaxneo:20170324172107j:plain

 

Minimum cutoffゲージを少し上げる。

f:id:kazumaxneo:20170324172135j:plain

 

すると下のように変化する。上のウィンドウを閉じると元に戻る。 

f:id:kazumaxneo:20170324172203j:plain

 

比較には、ゲノムの中央で大きなインバーション(逆位)が起きている2ゲノムを使っている。上の図を見るとそれが一目瞭然である。

 

 

 

次のデータは、ほぼ同じゲノム構造を持っているが、ざっくり1kbpに1つくらい塩基置換やindelが起きている生物種同士の比較(E.coliのK12とO157のような同じ種間の生物)。

 

f:id:kazumaxneo:20170324172231j:plain

端からみていくと、例えば下の領域には片方の生物しかない遺伝子が見つかる。

f:id:kazumaxneo:20170324172252j:plain

 

 

 

 次は生物としてはあまり近縁でないが、特殊な代謝系遺伝子セットをどちらの生物も持っている例。同調して機能する特定の遺伝子セット自体はまとまって存在しているが、下の図を見るとその部分だけ線が描かれ相同性が高くなっていることが分かる。

f:id:kazumaxneo:20170324172313j:plain

 

 もっと例を見たけば、Slide shareのリンクの108-109スライド目あたりが参考になる。 http://www.slideshare.net/leightonp/plant-pathogen-genome-data-my-life-in-sequences

 

 

実はACTはサポートするラッパーツールと組み合わせることで劇的に使いやすくなる。下のエントリーでそのことを紹介しています。ラッパーツールを入れて、blastからACTの比較までをほぼ自動化するやり方を紹介してますので、興味があればご覧ください。

 

 

 

 

 

備考: http://www.webact.org/WebACT/generateというACTの解析を自動化するサービスもあるが、こちらはうまくワークしないので検証できなかった。開設から時間が経っているのでもしかするとサーバーがゾンビ化してるのかもしれない。

 

 

参考 ---------------------------------------------------------------------------------------------------------------------------

1、Artemis-ACT instructions for NOVA cours  

http://www.pseudomonas-syringae.org/Artemis-ACT-NOVA.html  

 

2、ACT User manual ftp://ftp.sanger.ac.uk/pub/project/pathogens/workshops/BioLinux_Artemis_Data/Artemis-BioLinux.pdf