現在の細菌集団ゲノミクスのデータセットに含まれる豊富なデータを十分に活用するには、数百から数千の分離株における数百万塩基対にわたるさまざまなタイプの解析を統合し、統合する必要がある。現在のアプローチでは、系統学的、疫学的、統計学的、進化学的な解析結果を静的に表現していることが多く、相互に関連付けることが難しい。Phandangoは、ウェブブラウザ上で動作するインタラクティブなアプリケーションであり、複数のゲノム解析手法からの出力を直感的かつインタラクティブに組み合わせて、大規模な集団ゲノムデータセットを高速に探索することができる。Phandangoは、www.phandango.netで自由に利用できるウェブアプリケーションであり、サンプルとして多様なデータセットコレクションが含まれている。ソースコードと詳細なWikiページは、GitHubのhttps://github.com/jameshadfield/phandangoにある。
About
https://github.com/jameshadfield/phandango/wiki
https://jameshadfield.github.io/phandango/#/にアクセスする。
Example
Phandangoは、メタデータやゲノムデータにリンクされた系統樹(ツリー)を表示するように設計されている。これらのファイルは、適切なファイルがブラウザにドラッグされると(またはアプリから例の1つがロードされると)表示される。ほぼすべてのケースでツリーが必須となっている(系統樹なしでメタデータを表示しようとした場合など、不適切なデータ型に対しては警告が表示される)。
Mainに移動してGubbinsのtreeファイル(finalのツリーファイル:.final_tree.tre)をドラッグ&ドロップした。
図はトラックパッド/マウスホイールでズームできる。controlまたはcommandを押しながらズームすると、水平方向にのみツリーをズームできる。ノードを右クリックすると表示オプションが表示される。
GubbinsのGFF3をドラッグした。
上のセッティングには画面表示に関するパラメータがある。
https://github.com/jameshadfield/phandango/wiki/Input-data-formatsより
- メタデータはツリー内の関連する分類群に合わせて色分けされたブロックとして表示される。そのためツリーは必須。
- plink形式のGWAS結果を視覚化できる。GWAS視覚化時のゲノムアノテーションは表示の右上に表示される。このアノテーションはGFF3形式で、組換え/GWASの結果を視覚化するためには必須。末尾が.gffまたは.gff3でなければならない。
- BRAT NextGen(細菌データセット内の組換えイベントを検出するツール)の出力のタブ区切りのtxtファイル(デフォルトでsegments_tabular.txt)をを視覚化できる。
- ROARY出力のgene_presence_absence.csvを視覚化できる。
引用
Phandango: an interactive viewer for bacterial population genomics
James Hadfield, Nicholas J Croucher, Richard J Goater, Khalil Abudahab, David M Aanensen, Simon R Harris Author Notes
Bioinformatics, Volume 34, Issue 2, January 2018, Pages 292–293
参考
Roaryのパンゲノムプロット(株それぞれのパンゲノムを構成する遺伝子の有り/無し)とツリーを視覚化する。
http://sepsis-omics.github.io/tutorials/modules/roary/#vizualize-with-phandango
関連