macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

脊椎動物のオルソログデータベース OHNOLOGS v2

 

 ヒトを含むすべての脊椎動物は、2回の全ゲノム重複(2R-WGD)を経た祖先から進化してきた。また、テレオスの魚類では、さらに3回目のゲノム複製(3R-WGD)が行われている。これらのゲノム重複から保持された遺伝子、いわゆるオルソログは、脊椎動物の複雑性、発生、遺伝的疾患への感受性の進化に重要な役割を果たしてきた。しかし、脊椎動物のオルソログの同定は、2R-および3R-WGD以降の系統特異的なゲノムリアレンジメントのため、困難を極めていた。著者らはこれまでに、複数のゲノムにまたがる新規な対称性比較を用いて脊椎動物のオルソログを同定してきた。脊椎動物のオルソログを同定するために、2R-および3R-WGDの両方の系統的に偏ったサンプリングを考慮しながら、27の脊椎動物ゲノムを対象にこのアプローチを改良し、適用した。脊椎動物のOHNOLOGS v2データベースを拡張し、脊椎動物のオルソログペアとファミリーを収集した。その結果、テレポストの魚類は哺乳類やサウロプシ類よりも2R-WGDのオーソログを多く保持しており、これらの2R-OHNOLOGは、2R-OHNOLOGを持たない遺伝子よりも、後続の3R-WGDのOHNOLOGを有意に多く保持していることがわかった。興味深いことに、サウロプシ類のように遺伝子の数が少ない種では、同じような、あるいはより高い割合でオルソログが保持されていることがわかった。OHNOLOGS v2は、WGDが脊椎動物に与える影響について、より深い進化ゲノム解析を可能にするはずであり、http://ohnologs.curie.fr から自由にアクセスできる。

 

help

http://ohnologs.curie.fr/cgi-bin/HelpPage.cgi

 

helpより

OHNOLOGSバージョン2.0の新機能は?
先祖代々の脊椎動物の全ゲノム重複(2R-WGD)で27個の新しい脊椎動物のゲノムを追加しました。
また、先祖代々のテレスト固有のWhole Genome Duplication(3R-WGD)によるテレスト魚類のゲノムを4本追加しました。
OHNOLOGS v2には、タンパク質をコードする遺伝子に加えて、非コードRNAのOHNOLOGSも含まれています(micro-RNA、sn-RNA、sno-RNAなど)。
収録されている脊椎動物やテレスト魚類の系統的に偏ったサンプリングを考慮した加重信頼度qスコアを実装しています(Singh and Isambert, Nucleic Acids Research, 2019)。

 

webサービス

http://ohnologs.curie.fr/にアクセスする。

f:id:kazumaxneo:20210224045838p:plain

 

searchから遺伝子名で検索できる。

f:id:kazumaxneo:20210517055051p:plain

ヒトのHLAを検索

f:id:kazumaxneo:20210517055123p:plain

完全一致は無かったが、キーワード"HLA"を含む遺伝子が表示された。表の右端には、yes|noでオルソログかどうか表示される。f:id:kazumaxneo:20210517055200p:plain

 

searchのもう1つの機能はq-scoreに基づく推定オルソログリストの生成。生物種とq-scoreの上限を指定する。デフォルトはIntermediateな0.01となっている。

f:id:kazumaxneo:20210517055611p:plain

偽のシンテニーを排除するために、各オルソログペアの統計的な信頼性を評価する定量的アプローチを開発した(Singh et al.PLoS Comput Biol 2015)。この定量的アプローチとそれに対応する0~1の範囲の「qスコア」は、各オーソログペアが単に偶然に同定された場合の確率を推定する。qスコアが低いほど、統計的に有意なオルソログペアであることを意味する。

  • Strict: q-score(outgroup) < 0.001 AND q-score(self) < 0.001
  • 中間:q-score(outgroup) < 0.01 AND q-score(self) < 0.01
  • リラックス:q-score(outgroup) < 0.05 AND q-score(self) < 0.3

(helpより)

 

出力

左端の列はファミリーサイズ、2行目だと6ファミリーで、A1CF、DND1、HNRNPR、RBM46、RBM47、SYNCRIPとある。

f:id:kazumaxneo:20210517055836p:plain

 

Browseからは、事前計算されたリストを見たりダウンロードすることができる。

f:id:kazumaxneo:20210517060354p:plain

 

引用

OHNOLOGS v2: a comprehensive resource for the genes retained from whole genome duplication in vertebrates
Param Priya Singh, Hervé Isambert
Nucleic Acids Research, Volume 48, Issue D1, 08 January 2020, Pages D724–D730,