macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ゲノムや特定の領域の配列比較結果をシンテニーブロックで視覚化する Easyfig

 

 比較ゲノミクスには、特にシンテニー領域の挿入、欠失、および変異の特定のための、シーケンシングされたゲノムの比較が含まれる。複数のゲノムの特定の領域間のアライメントを視覚化することは、株や種の間の表現型の変化の根底にある遺伝子型の違いを識別するための重要なステップである。たとえば、関連する原核生物ゲノム間の比較により、インテグロン、プロファージ、または病原性アイランドなどのモバイルエレメントを強調できる。これらのゲノム比較に基づく明確で正確な画像の準備は、通常、面倒なマニュアル編集(例:Thomson et al、2004; Venturini et al、2010)または分析ツールからのスクリーンスナップショット(例:Jackson et al 、2010; Kozak et al、2010)が必要で、また、 Artemis Comparison Tool(ACT; Carver et al、2005)およびMauve(Darling et al、2010)はどちらもpublication用の図を生成するために広く使用されている優れた比較ゲノム解析ツールの例である。通常、複数の領域を一度に表示すると、明瞭さが失われる。最近、エレガントな視覚化ツールが開発された(Guy et al、2010)。ただし、Rに依存しているため、スクリプト言語に慣れていないユーザーにとっては困難である。

 この論文では、アノテーションファイル(例:GenBankとEMBL)および BLAST(Altschul et al、1990)の表形式出力からの複数のゲノムまたはゲノム領域の比較図を描くPythonアプリケーション、Easyfigについて説明する。 Easyfigは、生物学者が複数のゲノムまたはゲノム領域間の比較を視覚化し、鮮明で出版品質の画像を迅速かつ簡単に作成できるように設計されている。

 

manual

https://github.com/mjsull/Easyfig/wiki/Installation

 

インストール

本体 GIthub

以下のページからバイナリをダウンロードできる。OSX版を選んだ。

Easyfig - downloads

解凍して中にあるEasyfigを叩く。

f:id:kazumaxneo:20191007161953p:plain

GUIが立ち上がる。

f:id:kazumaxneo:20191008010954p:plain


 

実行方法

Example1のチュートリアル手順を確認する。

1、下の画像左上のAdd Featureボタンを押し、example1フォルダにあるgenbankファイルを選ぶ。ここではNewport_Gifsy1.gbkとLT2_Gifsy1.gbkを選ぶ( ~50 Kb prophage regions from different Salmonella genome)。

f:id:kazumaxneo:20191008011549p:plain

 

2A、次にAdd blast Fileボタンをクリックしてblast tabular outoutファイルを選択する。Example1フォルダにあるNewport_Gifsy1_v_LT2_Gifsy1.blastn.outを選んだ。blastファイルがない場合、blast+にパスが通っていればEasyFigから実行することもできる。Generate blastnボタンを押せばblast比較が実行される。

f:id:kazumaxneo:20191008015624p:plain

 

2B、追加するとboxに表示される。Generate blastnボタンでblastを実行した時は、自動で右のウィンドウに追加される。

f:id:kazumaxneo:20191008011855p:plain

 

3、Save Asボタンを押して、画像保存パスを指定する。ここではExample1フォルダを選んだ。

f:id:kazumaxneo:20191008015851p:plain

 

4、一番下のCreate Figureボタンを押すと描画が始まる。しばらく待つ。

f:id:kazumaxneo:20191008011359p:plain

 

5、ジョブが終わると指定したsvaフォルダに.bmpができる。

.bmpOSXのプレビューアプリで開いた。 

f:id:kazumaxneo:20191008011506p:plain

blast結果に沿って騒動な領域がシンテニーブロックで可視化されている。

 

カスタマイズしていく。プロファージの配列がゲノムに逆向きにintegrateされていて、全体がinvrsionを起こしているように見える。まずはこれを正向きに修正する。

6、Image => Subregionsを選択。

f:id:kazumaxneo:20191008012537p:plain

 

7、ポップアップウィンドウが出てくるので、右端のReverseのウインドウについて、2つめのファイルのnoをクリックする。さらに小さなポップアップが出てくるので、ReverseにチェックをつけてSave and closeをクリックしてcloseする。

f:id:kazumaxneo:20191008013047p:plain

初期状態では右下のボタンが見えないかもしれません。ウィンドウサイズを少し大きくすると出てきます。

 

8、大きい方のポップアップウィンドウも閉じる。右下のcloseボタンを押す。プロファージ領域全体が同じ向きで比較されるようになった。

f:id:kazumaxneo:20191008013735p:plain

 

アノテーションに色をつける。

9、Image => Anotationを選択。

f:id:kazumaxneo:20191008014103p:plain

 

10、ポップアップウィンドウが出てくる。geneの横のレ点チェックを外す。

f:id:kazumaxneo:20191008014114p:plain

先ほどと同様、初期状態では一部ボタンが見えないかもしれません。ウィンドウを広げて下さい。

 

11、CDSのチェックをつける。

f:id:kazumaxneo:20191008014620p:plain

12、再描画する。

f:id:kazumaxneo:20191008014952p:plain

 

さらに指定した領域だけ視覚化していく。例えば、2配列間で変動の大きな領域のみ視覚化してみる。

13、Image => Subregionsを選択。1のファイルのMinをクリックし、出てきたウィンドウのMIn=32599、Max=50099を指定してSave and close。

f:id:kazumaxneo:20191008015340p:plain

大きい方のポップアップウィンドウ下にあるchange cutoffボタンからも同じことができる。

 

14、2のファイルについては、MIn=1、Max=15000にしてSave and close。

f:id:kazumaxneo:20191008015347p:plain

ポップアップウィンドウをclose。

 

15、Generate blastnボタンを押し、blast比較を再実行する。

f:id:kazumaxneo:20191008020421p:plain

 

16、再び描画する。

f:id:kazumaxneo:20191008020743p:plain

 

上のImageからは、blast感度を決めるBlast、出力画像のサイズや色を決めるFigure、GC%なども追加するGraphなども選べます。

f:id:kazumaxneo:20191008022510p:plain

 

Tutorial2

3つのgenbankファイル比較。default。

f:id:kazumaxneo:20191008023515p:plain

3つ以上の配列だと、genbankファイルを読み込む順番も気にした方がよい。上の画像だと、一番上と真ん中の配列はよく似ているが、一番下の配列とは少し距離があり、この配列を2番目に読み込むと両方の配列と距離が出てしまう。よって、この配列のgenbankを最後に読み込み、一番下になるように調節している。言い換えると、一番上と一番下の配列のblast比較は行なっていない。

 

Tutorial2ラスト(一部パラメータを変えてます)

f:id:kazumaxneo:20191008025920p:plain

 

Tutorial以外に、Easyfigを使っている論文やtwiiterも参考になります。

引用

Easyfig: a genome comparison visualizer
Mitchell J. Sullivan, Nicola K. Petty, Scott A. Beatson

Bioinformatics. 2011 Apr 1; 27(7): 1009–1010

 

関連