ヒトを含むすべての脊椎動物は、2回の全ゲノム重複(2R-WGD)を経た祖先から進化してきた。また、テレオスの魚類では、さらに3回目のゲノム複製(3R-WGD)が行われている。これらのゲノム重複から保持された遺伝子、いわゆるオルソログは、脊椎動物の複雑性、発生、遺伝的疾患への感受性の進化に重要な役割を果たしてきた。しかし、脊椎動物のオルソログの同定は、2R-および3R-WGD以降の系統特異的なゲノムリアレンジメントのため、困難を極めていた。著者らはこれまでに、複数のゲノムにまたがる新規な対称性比較を用いて脊椎動物のオルソログを同定してきた。脊椎動物のオルソログを同定するために、2R-および3R-WGDの両方の系統的に偏ったサンプリングを考慮しながら、27の脊椎動物ゲノムを対象にこのアプローチを改良し、適用した。脊椎動物のOHNOLOGS v2データベースを拡張し、脊椎動物のオルソログペアとファミリーを収集した。その結果、テレポストの魚類は哺乳類やサウロプシ類よりも2R-WGDのオーソログを多く保持しており、これらの2R-OHNOLOGは、2R-OHNOLOGを持たない遺伝子よりも、後続の3R-WGDのOHNOLOGを有意に多く保持していることがわかった。興味深いことに、サウロプシ類のように遺伝子の数が少ない種では、同じような、あるいはより高い割合でオルソログが保持されていることがわかった。OHNOLOGS v2は、WGDが脊椎動物に与える影響について、より深い進化ゲノム解析を可能にするはずであり、http://ohnologs.curie.fr から自由にアクセスできる。
help
http://ohnologs.curie.fr/cgi-bin/HelpPage.cgi
helpより
OHNOLOGSバージョン2.0の新機能は?
先祖代々の脊椎動物の全ゲノム重複(2R-WGD)で27個の新しい脊椎動物のゲノムを追加しました。
また、先祖代々のテレスト固有のWhole Genome Duplication(3R-WGD)によるテレスト魚類のゲノムを4本追加しました。
OHNOLOGS v2には、タンパク質をコードする遺伝子に加えて、非コードRNAのOHNOLOGSも含まれています(micro-RNA、sn-RNA、sno-RNAなど)。
収録されている脊椎動物やテレスト魚類の系統的に偏ったサンプリングを考慮した加重信頼度qスコアを実装しています(Singh and Isambert, Nucleic Acids Research, 2019)。
http://ohnologs.curie.fr/にアクセスする。
searchから遺伝子名で検索できる。
ヒトのHLAを検索
完全一致は無かったが、キーワード"HLA"を含む遺伝子が表示された。表の右端には、yes|noでオルソログかどうか表示される。
searchのもう1つの機能はq-scoreに基づく推定オルソログリストの生成。生物種とq-scoreの上限を指定する。デフォルトはIntermediateな0.01となっている。
偽のシンテニーを排除するために、各オルソログペアの統計的な信頼性を評価する定量的アプローチを開発した(Singh et al.PLoS Comput Biol 2015)。この定量的アプローチとそれに対応する0~1の範囲の「qスコア」は、各オーソログペアが単に偶然に同定された場合の確率を推定する。qスコアが低いほど、統計的に有意なオルソログペアであることを意味する。
- Strict: q-score(outgroup) < 0.001 AND q-score(self) < 0.001
- 中間:q-score(outgroup) < 0.01 AND q-score(self) < 0.01
- リラックス:q-score(outgroup) < 0.05 AND q-score(self) < 0.3
(helpより)
出力
左端の列はファミリーサイズ、2行目だと6ファミリーで、A1CF、DND1、HNRNPR、RBM46、RBM47、SYNCRIPとある。
Browseからは、事前計算されたリストを見たりダウンロードすることができる。
引用
OHNOLOGS v2: a comprehensive resource for the genes retained from whole genome duplication in vertebrates
Param Priya Singh, Hervé Isambert
Nucleic Acids Research, Volume 48, Issue D1, 08 January 2020, Pages D724–D730,