macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

配列のアノテーションに用いられる Sequence Ontology

 

 

Sequence Ontology(SO)は、配列のアノテーションに用いられる、配列の特徴を定義するための共同オントロジー・プロジェクト。SOのサイトでは、既存のオントロジーを確認することができる。簡単に見ていきます。

 

Request A Term

https://github.com/The-Sequence-Ontology/SO-Ontologies/issues

 

webサイト

http://www.sequenceontology.org/miso/current_svn/term/SO:0001823にアクセスする。

Sequence Ontology browserでは、この画像のように、各語彙の関係を確認することができます。

 

VCF foamtのドキュメントで予測される影響がHIGHに分類されている語彙の1つ、exon_loss_variantを見てみます。

 

exon_loss_variantは、sequence_variantのカテゴリの語彙です。階層的なツリービュー表示だと以下の位置に配置されます(緑色)。

 

グラフノードビュー

is_aは語彙間の関係を表している。

(論文より)何かが「ある」ことに関する推論は、オントロジーの葉から根に向かって進行する。例えば、mRNAはkind_of processed_transcriptであり、processed_transcriptはkind_of transcriptである。したがって、mRNAはkind_of転写物である。kind_of関係は、is_a関係と同義である。

 

引用

The Sequence Ontology: a tool for the unification of genome annotations
Karen Eilbeck, Suzanna E Lewis, Christopher J Mungall, Mark Yandell, Lincoln Stein, Richard Durbin & Michael Ashburner 
Genome Biology volume 6, Article number: R44 (2005) 

 

関連