Phylogenetic profilesは、種間の遺伝子の有無パターンを捕捉する(Pellegrini et al、1999)。特定の種にオルソログが存在することは、対応する機能も表されていることの証拠となることがよくある(Lee et al、2007)。さらに、2つの遺伝子がそのPhylogenetic profilesで一致する場合、それらが機能的に相互作用することを示唆できる(Pellegrini et al、1999)。したがって、Phylogenetic profilesは、機能タンパク質クラスターまたは代謝ネットワークを種全体および経時的に追跡するために一般的に使用される。ただし、オルソロジーの推論はエラーフリーではなく(Altenhoff et al、2016)、オルソロジーは2つの遺伝子の機能的同等性を保証しない(Studer and Robinson-Rechavi、2009)。そのため、Phylogenetic profilesは、シーケンス類似性、ドメインアーキテクチャ類似性、または遺伝子オントロジーの語彙の記述の意味的類似性などの付属情報レイヤーと統合されることがよくある。このような強化されたPhylogenetic profilesを視覚化するためのさまざまなアプローチが存在する(一部略)。ただし、数百の遺伝子と分類群からなるマルチレイヤーのPhylogenetic profiles表示、フィルタリング、分析のための包括的な機能セットを提供するツールはまだ不足している。 PhyloProfileは、この方法論的なギャップを埋めるのに役立つ。
PhyloProfileは、オルソログまたはより一般的にはホモログのPhylogenetic profiles分布を主な入力として期待する。この情報は、ドメインアーキテクチャアノテーションと、最大2つの追加アノテーションレイヤーのデータで補完できる。このツールは、タブ区切りのテキストとシーケンスをFASTA形式で入力として受け入れる。スタンドアロンバージョンはさらにorthoXMLをサポートしている(Schmitt et al、2011)。カスタム入力の生成を容易にするために、いくつかのサンプルデータセットといくつかのヘルパースクリプトを提供する(一部略)。
PhyloProfileは、RのShinyパッケージ(https://CRAN.R-project.org/package=shiny)を使用したインタラクティブな視覚化で実装されている。種は自動的にNCBI taxonomyにリンクされ、ユーザー指定の基準taxonからの taxonomic distance 順に並べられる。あるいは、この目的のためにカスタム系統をアップロードすることができる。Phylogenetic profilesは、ドットマトリックスで表される(論文図1)。
https://github.com/BIONF/PhyloProfile/wiki/Input-Data
walk through slides
poster
https://f1000research.com/posters/6-1782
demo data
ここではwebサービスについて簡単に紹介する。
https://applbio.biologie.uni-frankfurt.de/phyloprofile/ にアクセスする。
.phyloprofileとdomainsファイルを順番に読み込むと、右端にPLOTボタンが出る。クリックすると視覚化される。
ここでは、HaMStR-OneSeqを使い、1遺伝子についてオルソログをアサインした結果を使う。HaMStR-OneSeq出力のphyloprofileとdomainsファイルを指定した。Plotボタンをクリックすると自動的に画面が更新され右隣のタブに移る。
視覚化された。
x-axisのfontを大きくして、全体のサイズを縦500 x 横1500にした。
デモデータを使うなら、phyloprofile-data/ampk-tor.md at master · BIONF/phyloprofile-data · GitHubのampk-tor.phyloprofileとampk-tor.domains_Fを指定する。
main inputボタンのところでampk-tor.phyloprofileを指定、それから下のannotation inputボタンのところでampk-tor.domains_Fを指定する。
もしくは入力のところでデモデータを指定する。
視覚化された。
出力された項目について二次的な解析を行う機能もある。
引用
PhyloProfile: dynamic visualization and exploration of multi-layered phylogenetic profiles
Ngoc-Vinh Tran, Bastian Greshake Tzovaras, Ingo Ebersberger
Bioinformatics, Volume 34, Issue 17, 01 September 2018, Pages 3041–3043
関連