ヒトの遺伝子アノテーションが不完全なままであることを示唆する証拠が増えてきているが、それが異なる組織にどのように影響し、異なる疾患の理解にどのような影響を与えるかは不明である。ここでは、41のヒト組織のGenotype-issue Expression RNAシーケンスデータから、これまでにアノテーションされていなかった転写を検出した。このアノテーションされていない転写を既知の遺伝子と結びつけることで、ヒトの遺伝子アノテーションは、Online Mendelian Inheritance in Man-morbidカタログの63%と317の神経変性関連遺伝子を含む、よく研究されている遺伝子の中でも、まだ不完全なままであることを確認した。脳内ではアノテーションされていない転写が最も多く、脳内で高度に発現している遺伝子は再アノテーションされている可能性が高いことがわかった。SNCAのような再アノテーションされた疾患遺伝子の例を探索している。組織特異的なトランスクリプトームはすべてvizER(http://rytenlab.com/browser/app/vizER)を通じて公開している。このリソースは、より正確な遺伝子解析を促進し、メンデル病や複雑な神経遺伝学的障害の理解に最も大きな影響を与えるものと期待している。
ここではvizERを紹介する。
vizER HPより
次世代シークエンシングにより、研究者はゲノム全体の変異を発見できるようになった。しかし、これらの突然変異のうち、どの突然変異が病気の原因となっているのかを患者単位で解読するために必要な知識は、遺伝子レベルでもバリアントレベルでも、特にゲノムのノンコーディング領域に存在する突然変異については、いまだに不完全である。我々は、現在メンデル病を引き起こすことが知られている遺伝子(OMIM遺伝子)の大部分の既存のアノテーションを改善し、バリアントの優先順位付けを助け、最終的には、病原性を割り当てるために使用することができる遺伝的地平を広げる(Zhang et al. Science Advances 2020)。このアノテーションは、特に機能的に重要なノンコーディングゲノム領域の同定において、疾患に関連する遺伝子や転写物に優先順位をつけるものである。臨床科学者や臨床医が関心のある遺伝子のアノテーションのミスアノテーションを可視化し、より良いバリアント優先順位付けを可能にし、結果としてメンデル疾患と複雑な遺伝学的疾患の両方の診断を可能にすることを第一の目標として、このオンラインウェブリソースであるvizERを開発した。
全ゲノムおよび全ゲノムシークエンシングの利用の増加により、メンデル病の遺伝学的検査の効率が向上しているにもかかわらず、推定50%の患者が遺伝学的診断を受けずに診療所を後にしている。これは、次世代シークエンシングによって検出された遺伝的変異を正確に解釈する能力が不足していることが一因である。しかし、遺伝子アノテーションデータベース間の不一致や多数の報告から、遺伝子アノテーションの知識はまだ十分とは言えないことが明らかになっている。ここでは、41種類の異なるGTEx組織すべての転写をアノテーションにとらわれない方法で検出・検証し、新規転写を既知の遺伝子と結びつけることで、最終的に既知のOMIM疾患遺伝子の63%のアノテーションが改善された。その結果、新規転写の大部分が組織特異的なものであることがわかり、脳組織が最もミスアノテーションの影響を受けやすいことがわかった。さらに、新規転写領域は保存状態が悪い傾向にあるが、ヒト内では遺伝的変異のために有意に減少していることから、機能的に重要であり、ヒト固有の機能を持つ可能性があることを示唆している。その結果、個々の遺伝子を可視化し、ミスアノテーションの証拠を調べることができるオンラインプラットフォームvizERを用いて、我々の知見を発表する。また、全ゲノムシーケンスデータとの統合を容易にするために、組織特異的なトランスクリプトームをBED形式で公開している。これらのリソースにより、幅広いメンデル疾患の診断率が向上することが期待されている(以下略)。
help
https://snca.atica.um.es/browser/endpoint/e0cbeebb-2527-45e0-9604-1428ad5b7311/
download
https://snca.atica.um.es/browser/endpoint/e0cbeebb-2527-45e0-9604-1428ad5b7311/
https://snca.atica.um.es/browser/app/vizER にアクセスする。
遺伝子名と組織を指定して検索する。ERLIN1遺伝子のcerebeller hemishereでの発現量を調べる。acceptボタンをクリックすると描画される。
出力
プロットは、関心のある遺伝子について、潜在的な誤注釈があるかどうかの判別を支援できるように設計されている(例えば、有意性が不明なバリアントとの重複など)。
全てのknown exonを含むcollpased exonic structure(黄色box)の上に様々なソースからの較正された発現領域(expressed regions; ER)情報、split read(genomeにギャップアラインメントされた(exon間)リード)が見つかったサンプルの多さを表す太線(緑線)などが表示される。詳細は公開サイトのhelp(vizER plot)参照。
簡単な説明になってしまいましたが、実際はより精緻な補正を行ってER情報を可視化しています。論文で確認して下さい。
引用
Incomplete annotation has a disproportionate impact on our understanding of Mendelian and complex neurogenetic disorders
David Zhang, Sebastian Guelfi, Sonia Garcia-Ruiz, Beatrice Costa, Regina H. Reynolds, Karishma D’Sa, Wenfei Liu, Thomas Courtin, Amy Peterson, Andrew E. Jaffe, John Hardy, Juan A. Botía, Leonardo Collado-Torres, Mina Ryten
Sci Adv. 2020 Jun; 6(24)
参考
GTEx Portalを使ってヒトの各組織での遺伝子発現量や影響するeQTLを調べる