ハイスループット技術の開発により、ほとんどの真核生物のRNAにnon-canonicalなショートオープンリーディングフレーム(sORF)が存在することが明らかになった。これらは、種を超えて高度に保存されたユビキタスな遺伝的要素であり、多くの細胞プロセスに関与していると考えられている。MetamORF (http://metamorf.hb.univ-amu.fr/) は、ヒトおよびマウスのゲノム上で同定されたユニークなsORFのリポジトリを、実験と計算の両方のアプローチで提供することを目的としている。公開されているsORFデータを収集し、正規化し、冗長な情報を要約することで、合計1,162,675個のユニークなsORFを同定することができた。ORFを短い、上流、下流のいずれかに分類するのが一般的であるにもかかわらず、これらのカテゴリーの定義に関する明確なコンセンサスは現在のところ存在しない。そのため、データは正規化された命名法を用いて再処理されている。MetamORFは、遺伝子座、遺伝子、転写産物、ORFレベルでの新たな解析を可能にし、将来的にはsORFの機能に関する新たな疑問を解決する可能性を提供する。リポジトリは、ユーザーフレンドリーなWebインターフェースで利用可能で、簡単なブラウジング、可視化、複数の条件でのフィルタリング、エクスポートが可能である。データベースの内容は、UCSC Genome Browserのトラックハブを介して利用できるようになっている。
MetamORFウェブインターフェースは、データの閲覧、複数の基準(ORFの長さ、アノテーション、細胞タイプなど)を用いた可視化やフィルタリング、結果のエクスポートが可能である。現在のウェブインターフェースに加えて、データベースのコンテンツはUCSC Genome Browserのトラックハブを介して利用可能である。これらのゲノムトラックへのリンク、およびUCSCゲノムトラックからMetamORFのウェブサイトへのリンクが実装されており、1つのトラックから別のトラックへのナビゲートを支援している。
Tutorial
http://metamorf.hb.univ-amu.fr/doc#docTutorial
Download
http://metamorf.hb.univ-amu.fr/downloads
macのsafariだと検索機能が動作しなかったため、chromeを使用した (対応の詳細はtutorialのWeb browser compatibilityを参照)。
http://metamorf.hb.univ-amu.fr/searchにアクセスする。
GENEを検索してみる。GENEをクリック。
MetamORFデータベースではORFを持たないsORFは登録されていないので注意する。
Speciesを選択。
H. sapiensとM. musculusが選べる。
絞り込みできるようになっている。
複数の遺伝子で同じエイリアスが使われている場合などで、提供されている参照先が曖昧な場合は、中間ページに移動し、選択を正確に行うように指示される。
検索結果
その遺伝子座のsORFの一覧が表示される。
結果はBED、CSV、FASTA(NT/AA)形式でダウンロードできる。
GROUP BY TRANSCRIPTS
転写パターンが異なりTRANSCRIPTS IDが複数ある場合、TRANSCRIPTS IDごとにまとめて表示できる。
sORFのリンクを1つクリックしてみた。ポジションや配列など、そのsORFに関する情報がまとめられる。
中央のGENOME BROWSERSボタンはUCSC genome browserにリンクしている。
(試した時はエラーになった)
BROWSEでは、セルタイプで区別して閲覧することもできる。
種とセルタイプを選択。
humanのB.cellブラウズ結果
引用
MetamORF: A repository of unique short Open Reading Frames identified by both experimental and computational approaches for gene-level and meta-analysis
Sebastien A. Choteau, Audrey Wagner, Philippe Pierre, Lionel Spinelli, Christine Brun
bioRxiv, Posted November 14, 2020