macでインフォマティクス

読者です 読者をやめる 読者になる 読者になる

Artemis comparison tool (ACT)の使用法

2つ以上のゲノムを比較して、塩基配列同一性の高い領域を描画するソフト。3つ以上のゲノムを同時に比較することも可能。必要なのは比較する生物種ごとのfastaファイルと遺伝子のアノテーションファイル(genebankフォーマットなど)。

 

1、ブラスト解析 はじめに比較する配列間でブラスト解析を行い、それからACTを起動する流れになる。ブラスト解析はローカル環境で行ってもよいが、ACT用にクラウドでブラスト解析を行ってくれるHPがあるので、それを使ってみる。

http://www.hpa-bioinfotools.org.uk/pise/double_actv2.html#_data

f:id:kazumaxneo:20170324171651j:plain

 

fasta入力画面

 

 

 本当ならgenebank形式のファイルを受け付けてくれると便利だが、fastaフォーマット以外対応していない。fasta形式のファイルを2つ入れる。blastnかblastpを選び、メールアドレスを記入して実行。もともとblastツールがかなり高速化されているため、プラスミドのような小さいゲノムだと瞬時に終わる。

 

f:id:kazumaxneo:20170324171719j:plain

ブラスト終了後の画面

 

 

上のgenome_blast.result を右クリックして "リンク先のファイルをダウンロード"でダウンロードする。ここまでの作業はlocal blastでも実行できる。その場合は -outfmt 6をつけて実行し、タブ形式のブラストファイルを出力する。

 

 

2、ACTのインストール ダウンロードはここから http://www.sanger.ac.uk/science/tools/artemis-comparison-tool-act だが、mac OS sierraには対応していないようで、ローカルアプリ版は起動できない。 上のリンクから、java web start版をクリックする。 ダウンロードしたアイコンを叩くと起動するが、sierraではApp store以外から落としたファイルを起動できない。 怒られたら、リンゴマークから環境設定を起動し、セキュリティとプライバシの項目のこのまま開くをクリック、を選択する。

f:id:kazumaxneo:20170324171808j:plain

 

パスを入れて起動する。それでも怒られる場合、jabaのセキュリティ

 

に例外URLを登録する必要がある。リンゴマーク -> 環境設定 -> javaを選択。

f:id:kazumaxneo:20170324171838j:plain

 

java-> セキュリティタブをクリック。サイトリストの編集をクリック

f:id:kazumaxneo:20170324172442j:plain

http://www.genedb.org を追加して保存。もう一度ダウンロードしたファイルを叩くと、また文句を言われるが起動できるようになる。

 

2、ACTの起動 起動したら、File -> Open ...を選択。

f:id:kazumaxneo:20170324171924j:plain

ブラスト解析に使ったfastaのorf情報を含むファイル(genebank形式は対応)2つを選択。comparison fileにはブラスト解析でダウンロードしたテキストファイルを選択。

f:id:kazumaxneo:20170324172020j:plain

ゲノムが似たもの同士を比較すると、初期条件ではこのように蜘蛛の巣を張ったような感じになる。

f:id:kazumaxneo:20170324172043j:plain

 

 

閾値を上げて完全マッチだけ取り出す。画面で右クリックしてSet Score Cutoffを選択

f:id:kazumaxneo:20170324172107j:plain

 

Minimum cutoffゲージを少し上げる。

f:id:kazumaxneo:20170324172135j:plain

 

すると下のように変化する。上のウィンドウを閉じると元に戻る。 

f:id:kazumaxneo:20170324172203j:plain

 

 

比較に使ったゲノムは、ゲノムの中央で大きなインバーションが起きていることが知られているが、それ以外ほぼ同一のゲノム構造を保持している。

 

 

 

 

次のデータは、ほぼ同じゲノム構造を持っているが、ざっくり1kbpに1つくらい塩基置換やindelが起きている生物種同士の比較。

f:id:kazumaxneo:20170324172231j:plain

端からみていくと、例えば下の領域には片方の生物しかない遺伝子が見つかる。

f:id:kazumaxneo:20170324172252j:plain

 

 

 

次は同調して機能することがわかっている遺伝子セットの比較。2生物のゲノムはそこまで似ていないことが知られているが、同調して機能する特定の遺伝子セット自体はまとまって存在していることがわかる。

f:id:kazumaxneo:20170324172313j:plain

 

 

もっと例を見たけば、Slide shareのリンクの108-109スライド目あたりが参考になる。 http://www.slideshare.net/leightonp/plant-pathogen-genome-data-my-life-in-sequences 備考: http://www.webact.org/WebACT/generateというACTの解析を自動化するサービスもあるが、こちらはうまくワークしないので検証できなかった。開設から時間が経っているのでもしかするとサーバーがゾンビ化してるのかもしれない。それかファイルやブラウザの組み合わせの相性が悪いのかもしれないが、全く動作しなかったので原因は不明。

 

 

 

参考 ---------------------------------------------------------------------------------------------------------------------------

1、Artemis-ACT instructions for NOVA cours   http://www.pseudomonas-syringae.org/Artemis-ACT-NOVA.html

 

2、ACT User manual ftp://ftp.sanger.ac.uk/pub/project/pathogens/workshops/BioLinux_Artemis_Data/Artemis-BioLinux.pdf