同じパスウェイ、タンパク質複合体、または同じ環境条件で機能するタンパク質は、系統発生クレード全体で類似した配列保存パターンを示すことがある。特定のタンパク質複合体またはパスウェイをもはや必要としない種では、これらのタンパク質は、グループとして、失われるか分岐する傾向がある。真核生物の大規模なセットにわたる配列保存のパターンの類似性の分析から、異なるタンパク質間の機能的関連を予測し、新しいパスウェイのメンバーを特定し、以前に特徴付けられていないタンパク質の機能を明らかにすることができる。正規化された系統発生プロファイリングを使用して、タンパク質機能を予測し、新しいパスウェイメンバーと疾患遺伝子を特定した。ヒト、マウス、Caenorhabditis elegans、およびショウジョウバエのゲノムに保存されている何万ものタンパク質の系統発生プロファイルは、新しいWebサーバーPhyloGeneで照会できる。 PhyloGeneは直観的で使いやすいプラットフォームを提供し、86の動物、真菌、植物、原生生物ゲノムの保存パターンを照会する。タンパク質クエリは、集中的に研究された種の全ゲノムタンパク質セットから名前を選択するか、タンパク質配列を入力することにより送信できる。グラフィック出力は、クエリの配列保存のプロファイルと、選択したゲノム内のタンパク質の最も類似した系統発生プロファイルを示している。ユーザーはこの出力を数値形式でダウンロードすることもできる。
チュートリアルも用意されているが、現在はリンク切れになっている。
http://genetics.mgh.harvard.edu/phylogene/update_1117/help_text.htm
http://genetics.mgh.harvard.edu/phylogene/ にアクセスする。
初期はヒトになっている。
タンパク質名を選択する。ここではACE2を選択した。
またはタンパク質配列をアップロードすることもできる。
ヒートマップが表示された。ヒートマップのX軸はクエリの真核生物ゲノムに対応しており、主要な分類(動物、菌類、植物、原生生物)にグループ化され、保存パターンを手動で簡単に確認できるようになっている。ヒートマップのy軸は、検索したゲノムのタンパク質の系統的プロファイルが、検索したタンパク質のプロファイルと最も類似しているタンパク質に対応している。一番上の行はクエリタンパク質のプロファイルに対応している。
上はACE2(一番上)とそれに似た保存パターンを持つタンパク質の検索結果。
ヒートマップは、ヒートマップ行の左に表示されているタンパク質との配列類似性がないものが白で、配列保存率が高いものほど紺色で表示される。左端の遺伝子名は Ensembl (http://www.ensembl.org) へリンクしている。
ヒートマップの左端2つの列は色が異なっているが、これはピアソン相関係数とクエリとの類似度の統計的有意性を表している。
出力はエクセルファイル形式でダウンロードできる。
他にもPhylogeneという名前のツールがあるようです。注意して下さい。
引用
PhyloGene server for identification and visualization of co-evolving proteins using normalized phylogenetic profiles
Ilyas R. Sadreyev, Fei Ji, Emiliano Cohen, Gary Ruvkun, Yuval Tabach
Nucleic Acids Res. 2015 Jul 1;43(W1):W154-9
関連