macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

webで動作する高速で軽量な分子系統樹可視化ツール IcyTree

 

 系統樹の可視化は、計算系統学(computational phylogenetics)の極めて重要な側面である。確かに、よく知られているテキスト「Inferring Phylogenies」(Felsenstein、2003)(amazon) は、このトピックに全章を割いている。従って、系統樹可視化ソフトウェアの進化が系統発生推論 ( phylogenetic inference) のための高度なアルゴリズム及びソフトウェアの開発としばしば相互に関連していることは偶然ではない。 PHYLIP(Felsenstein、1989)、MacClade(Maddison and Maddison、1989)、MrBayes(Ronquist et al、2012)などの最も初期の利用可能な系統発生推論パッケージの多くは、それらの出力を視覚化するためのビルトインサポートを含む。PhyML(Guindon and Gascuel、2003)やBEAST(Bouckaert et al、2014)のような他のパッケージは、図形出力を生成せず、代わりにFigTree(http://tree.bio.ed.ac.jp  link)やDendroscope(Huson and Scornavacca、2012 link)などの特殊な系統発生可視化ツールに依存している。

 現在では、たくさんのスタンドアロンの系統発生可視化ツールが存在しており、名前を上げるには多すぎる (PHYLIPのホームページには、そのようなプログラムのオンラインリストが提供されており、現在60のエントリが含まれている)。可視化問題に対する既存の解​​決策は非常に多いが、パッケージIcyTreeはいくつかの重要な点で重要な特徴を持っている。

 まず、IcyTreeは非常に簡単にアクセスできる。これはJavaScriptでフルに書かれており、一般的なWebブラウザGoogle ChromeMozilla Firefoxの最新バージョンへの互換性)で動作する。追加プラグインを必要とせず、ホームページにナビゲートするだけで読み込まれる。つまり、IcyTreeを更新する必要はない。重要なのは、既存のJavaScriptベースの系統発生ツールの多くと異なり、IcyTreeは実行中にサーバーとやりとりすることはない。これにより、ユーザーはオンラインサービスにデータをアップロードすることによるプライバシーの影響を気にする必要はなくなる。

 第2にJavaScriptSVGグラフィカルフォーマットを組み合わせ、IcyTreeはレスポンスを維持しながら数千または数万の分類群を含むツリーを表示することができる。これはまた、数千の分類群を含む大きなファイルを素早くロードできることを意味する。

 第3に、IcyTreeは非常に軽量であり、ベイズ系系統推論パッケージによって推論されたものなどのrooted phylogenetic time treesの描画に焦点を当てている。これにより、使用可能なオプションの数が管理可能になる。マウスを使って、またはキーボードショートカットの豊富なレパートリーを使ってプログラムオプションにアクセスできるようにすることに重点を置いている(一部略)。

 最後に、IcyTreeは、Newick、NEXUS(Maddison et al、1997)(BEASTとMrBayesが使用)、PhyloXML(Han and Zmasek、2009)、NeXML(Vos et  et al、2012)などの様々なフォーマットに対応している。 Extended Newickフォーマット(Cardona et al、2008)を用いて特定された系統発生ネットワークもまたサポートされる(IcyTreeのそのようなネットワークをレンダリングするために使用するスタイルは、Bacter(Vaughan et al、2017 pubmed)によって推論されたようなancestral recombination graphに特に適している)。

 

マニュアル

https://icytree.org/manual/

Github

動作環境

入力に利用可能なフォーマット(詳細はオンラインマニュアル参照)

 

テストラン

オンライン版の動作をmac ossafariを使って確認した。著者が用意したexample ファイル(link)を使った。

 

IcyTreeにアクセスする。

 

https://icytree.org

f:id:kazumaxneo:20181008233920p:plain

 

LoadからNewick形式などの利用可能なファイルを読み込ませて描画する。windowsに直接ドダッグするか、Enter tree directlyでNewickフォーマットのファイルの中身を直接ペーストしても描画できるようになっている。その他、URLを指定して描画することにも対応している。

f:id:kazumaxneo:20181009101921j:plain

 

テストデータとして用意されている、霊長類のNewick形式のファイルを開いてみる。

open directly

f:id:kazumaxneo:20181009102107j:plain

図はマウスのホイールやtrackpadの上下で拡大縮小したり、画面をドラッグして移動できるようになっている。shiftキーを押しながら拡大縮小動作を行うと、水平方向のみに拡大縮小する。やCtrlキー押しながらだと、垂直方向にのみ拡大縮小する。たくさんのデータがあるとき、調整するのに使う(test link)。

カーソルを枝に合わせると、その枝の情報がポップアップ表示される。

f:id:kazumaxneo:20181009104857j:plain

 

 

スタイルからは様々な調整ができる(マニュアル)。

ソート方法

f:id:kazumaxneo:20181009103047j:plain

 ツリーレイアウト

f:id:kazumaxneo:20181009103202j:plain

フォントサイズ ( [ , ] )

f:id:kazumaxneo:20181009103655j:plain

 レジェンド表示 (g)

f:id:kazumaxneo:20181009104158j:plain

右端にマークがある時はキーボードショートカットにも対応している。

 

 

BFASTBFAST2のようなツールは、ノードの不確かさのエラーバーつきファイルを出力できる(例えばこの論文の図)。そのエラーバーを表示する。

f:id:kazumaxneo:20181009110030j:plain

 

 目的や好みに合わせ、様々なスタイル変更が可能

f:id:kazumaxneo:20181009104002j:plain

画面にファイルをドラッグすると、描画した後でも新しいデータに更新される。 

 

データは複数のフォーマットでExportできる。

f:id:kazumaxneo:20181009110259j:plain

 

 

 

シンプルな統計機能も備えている。

f:id:kazumaxneo:20181009111317j:plain

Lineage through time plots (LTT-plot). (説明link)

f:id:kazumaxneo:20181009111257j:plain

Skyline plot ( Pybus et al., 2000 , Strimmer and Pybus, 2001)

f:id:kazumaxneo:20181009111546j:plain

Tree Statistics

f:id:kazumaxneo:20181009111226j:plain

 

 

引用
IcyTree: rapid browser-based visualization for phylogenetic trees and networks
Vaughan TG

Bioinformatics. 2017 Aug 1;33(15):2392-2394