比較ゲノミクスには、特にシンテニー領域の挿入、欠失、および変異の特定のための、シーケンシングされたゲノムの比較が含まれる。複数のゲノムの特定の領域間のアライメントを視覚化することは、株や種の間の表現型の変化の根底にある遺伝子型の違いを識別するための重要なステップである。たとえば、関連する原核生物ゲノム間の比較により、インテグロン、プロファージ、または病原性アイランドなどのモバイルエレメントを強調できる。これらのゲノム比較に基づく明確で正確な画像の準備は、通常、面倒なマニュアル編集(例:Thomson et al、2004; Venturini et al、2010)または分析ツールからのスクリーンスナップショット(例:Jackson et al 、2010; Kozak et al、2010)が必要で、また、 Artemis Comparison Tool(ACT; Carver et al、2005)およびMauve(Darling et al、2010)はどちらもpublication用の図を生成するために広く使用されている優れた比較ゲノム解析ツールの例である。通常、複数の領域を一度に表示すると、明瞭さが失われる。最近、エレガントな視覚化ツールが開発された(Guy et al、2010)。ただし、Rに依存しているため、スクリプト言語に慣れていないユーザーにとっては困難である。
この論文では、アノテーションファイル(例:GenBankとEMBL)および BLAST(Altschul et al、1990)の表形式出力からの複数のゲノムまたはゲノム領域の比較図を描くPythonアプリケーション、Easyfigについて説明する。 Easyfigは、生物学者が複数のゲノムまたはゲノム領域間の比較を視覚化し、鮮明で出版品質の画像を迅速かつ簡単に作成できるように設計されている。
manual
https://github.com/mjsull/Easyfig/wiki/Installation
インストール
本体 GIthub
以下のページからバイナリをダウンロードできる。OSX版を選んだ。
解凍して中にあるEasyfigを叩く。
GUIが立ち上がる。
実行方法
Example1のチュートリアル手順を確認する。
1、下の画像左上のAdd Featureボタンを押し、example1フォルダにあるgenbankファイルを選ぶ。ここではNewport_Gifsy1.gbkとLT2_Gifsy1.gbkを選ぶ( ~50 Kb prophage regions from different Salmonella genome)。
2A、次にAdd blast Fileボタンをクリックしてblast tabular outoutファイルを選択する。Example1フォルダにあるNewport_Gifsy1_v_LT2_Gifsy1.blastn.outを選んだ。blastファイルがない場合、blast+にパスが通っていればEasyFigから実行することもできる。Generate blastnボタンを押せばblast比較が実行される。
2B、追加するとboxに表示される。Generate blastnボタンでblastを実行した時は、自動で右のウィンドウに追加される。
3、Save Asボタンを押して、画像保存パスを指定する。ここではExample1フォルダを選んだ。
4、一番下のCreate Figureボタンを押すと描画が始まる。しばらく待つ。
5、ジョブが終わると指定したsvaフォルダに.bmpができる。
blast結果に沿って騒動な領域がシンテニーブロックで可視化されている。
カスタマイズしていく。プロファージの配列がゲノムに逆向きにintegrateされていて、全体がinvrsionを起こしているように見える。まずはこれを正向きに修正する。
6、Image => Subregionsを選択。
7、ポップアップウィンドウが出てくるので、右端のReverseのウインドウについて、2つめのファイルのnoをクリックする。さらに小さなポップアップが出てくるので、ReverseにチェックをつけてSave and closeをクリックしてcloseする。
初期状態では右下のボタンが見えないかもしれません。ウィンドウサイズを少し大きくすると出てきます。
8、大きい方のポップアップウィンドウも閉じる。右下のcloseボタンを押す。プロファージ領域全体が同じ向きで比較されるようになった。
アノテーションに色をつける。
9、Image => Anotationを選択。
10、ポップアップウィンドウが出てくる。geneの横のレ点チェックを外す。
先ほどと同様、初期状態では一部ボタンが見えないかもしれません。ウィンドウを広げて下さい。
11、CDSのチェックをつける。
12、再描画する。
さらに指定した領域だけ視覚化していく。例えば、2配列間で変動の大きな領域のみ視覚化してみる。
13、Image => Subregionsを選択。1のファイルのMinをクリックし、出てきたウィンドウのMIn=32599、Max=50099を指定してSave and close。
大きい方のポップアップウィンドウ下にあるchange cutoffボタンからも同じことができる。
14、2のファイルについては、MIn=1、Max=15000にしてSave and close。
ポップアップウィンドウをclose。
15、Generate blastnボタンを押し、blast比較を再実行する。
16、再び描画する。
上のImageからは、blast感度を決めるBlast、出力画像のサイズや色を決めるFigure、GC%なども追加するGraphなども選べます。
Tutorial2
3つのgenbankファイル比較。default。
3つ以上の配列だと、genbankファイルを読み込む順番も気にした方がよい。上の画像だと、一番上と真ん中の配列はよく似ているが、一番下の配列とは少し距離があり、この配列を2番目に読み込むと両方の配列と距離が出てしまう。よって、この配列のgenbankを最後に読み込み、一番下になるように調節している。言い換えると、一番上と一番下の配列のblast比較は行なっていない。
Tutorial2ラスト(一部パラメータを変えてます)
Tutorial以外に、Easyfigを使っている論文やtwiiterも参考になります。
引用
Easyfig: a genome comparison visualizer
Mitchell J. Sullivan, Nicola K. Petty, Scott A. Beatson
Bioinformatics. 2011 Apr 1; 27(7): 1009–1010
関連