macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

複数の系統的証拠を利用してオルソログとパラログを予測する MetaPhOrs

2020 8/17 追記と誤字修正

 

 異なる種の遺伝子間の相同性関係を推定することは、比較ゲノム学の中心的な課題である。そのため、長年にわたって多くのリソースと方法が開発されてきた。公開されているデータベースの中には、相同な遺伝子ファミリーの系統樹が含まれており、相同性関係をさらにorthologyとparalogyに区別して使用することができる。MetaPhOrsは、異なるソースからの系統情報を統合して、共通の系統情報に基づいた予測アルゴリズムに基づいて直交関係と類縁関係を提供し、一貫性に基づいた信頼度スコアに関連付けたウェブサーバである。ここでは、主要な新しい実装を含むウェブサーバの最新バージョンについて説明する。MetaPhOrsサーバは、http://orthology.phylomedb.org/ で登録なしで自由に利用できる。

 

 

MetaPhOrs video tutorial

f:id:kazumaxneo:20200815005137p:plain

 

 

webサービス

http://orthology.phylomedb.orgにアクセスする。

f:id:kazumaxneo:20200815003546p:plain

 

遺伝子名をタイプして検索する。

f:id:kazumaxneo:20200816235242p:plain



次にどの生物の配列を使うかを選択する。種名とDescriptionを確認し、該当する行の左端のsearchボタンを押して検索を実行する。

f:id:kazumaxneo:20200816235333p:plain

 

下はHomo sapiensのTP53をクエリにして。オーソロガスな配列を検索した結果になる。下の写真に記載されているように、91の種から(CS > 0.5を満たす)125 オルソログが見つかった(論文のUSE CASESと同じ結果)。

f:id:kazumaxneo:20200817001932p:plain

 

自分自身、つまりヒトのTP53は除かれている。

 

探索結果の下には設定を満たすオルソログをまとめた表が表示される。

f:id:kazumaxneo:20200817000100p:plain

 

表は特定の順番でソートされている。まずはELカラムをクリックして、ELの降順でソートしてみる。ELはEvidence levelで、ヒットした情報源(データベース)の数を表す。この値が高いほど、より多くの情報源が予測の推論に使用されており、予測の信頼性が高い傾向がある。表右の緑マークがヒットを表す。内部にconfidential scoreが表示されている。

f:id:kazumaxneo:20200817001639p:plain

MetaPhOrs2は13の外部データベースを使っているため、search結果のEL値は1から13の間の値をとる(1データベースでも見つかれば結果に含まれる)。しかしHomo sapiens TP53は6つのデータベースからのみ取得されているため、EL値は最大で6となる。これは、データベースが完全には重複していないためである。

 

今度はCL(confidential scoreの合計)降順ソートした。データベースが6つなら最大6になる。先ほどと同じくDanio rerioのオルソログがトップヒットになった。

f:id:kazumaxneo:20200817002849p:plain

 

表の各行にあるorthologsをクリックすると詳細が表示される。

f:id:kazumaxneo:20200817221802p:plain

 

詳細が表示される。

f:id:kazumaxneo:20200817221933p:plain

 

表はPDFやテキストとしてダウンロードできる。ヒットしたオルソログのアミノ酸配列もダウンロード可能になっている。

 

引用
MetaPhOrs 2.0: integrative, phylogeny-based inference of orthology and paralogy across the tree of life

Uciel Chorostecki, Manuel Molina , Leszek P Pryszcz, Toni Gabaldón

Nucleic Acids Res. 2020 Jul 2;48(W1):W553-W557


MetaPhOrs: orthology and paralogy predictions from multiple phylogenetic evidence using a consistency-based confidence score

Leszek P Pryszcz, Jaime Huerta-Cepas, Toni Gabaldón

Nucleic Acids Res. 2011 Mar;39(5):e32