macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

GOアノテーション間の関係と類似性を調べるwebサーバー NaviGO

 

 

 遺伝子の機能解明は、バイオインフォマティクスを含む現代の生物学における中心的な問題の1つである。体系的な機能的アノテーションのために、GOは遺伝子機能の語彙(以後、term)として広く使われている[ref.1]。 GO termは、term間の親の関係が表されている階層型有向非巡回グラフ(DAG)に配置される。 GOはGene Ontology Consortium [ref.2]によって定期的に更新され、現在44,000以上のtermを保持している。 DAG構造は、3つの異なるGOカテゴリー(3つの切断されたroot)、すなわち、Biological Process(BP)、Molecular Function(MF)、およびCellular Component(CC)に分けられる。大量のtermとそれらの親の関係は、遺伝子のGOアノテーションの直感的な要約を提供することを重要にする。

 AmiGO [ref.3]は、Gene Ontology Consortium [ref.2]によって管理されているオンラインツールで、遺伝子オントロジーデータベースを検索および閲覧するために広く使用されている。これ以外に、GOの視覚化と比較に使用できる他の既存のツール[ref.4] - [ref.6]がある。遺伝子オントロジーアノテーション(GOA)プロジェクトの下で開発されたツールであるQuickGO(link)は、特定のGOを持つGO termおよび遺伝子の検索を可能にし、そして静的なクリック可能なマップを提供する[ref.7]。既存のワークの欠点は、静止画像またはSVGフォーマットのいずれかでGO DAGトポロジーを視覚化する静的な方法を提供するが、トポロジがこれらのサーバーのフロントエンドで生成されると、ユーザーはリアルタイムでインタラクティブにGO階層のさまざまなブランチを探索することができない。 GO termの単純なタスク、たとえば、クエリGO termからすべての親termをリストすること、またはGO termをマッピングしてGO DAG上で視覚化することは、既存のWebベースのツールでは簡単ではない。親のGO termをブラウズし、DAGトポロジー内のGO termをインタラクティブに視覚化して関連 termを見つけることは、研究対象の遺伝子の機能アノテーションを把握するための基本である。

 本研究では、3つの側面で既存のGOベースのWebツールよりも優れた利点を提供する、GO termと遺伝子機能の包括的な分析のための新しいインタラクティブなWebベースツール、NaviGOを紹介する。 GO DAGのレンダリングは、GO Visualizer [ref.8]という名前で、即座にユーザー入力のGO termをGO DAGにマッピングする。マッピングにより、ユーザー入力のGO termの親termが色付けされ、それらの類似性が直感的に理解できる(類似性スコアはGO DAGのトポロジに基づいているため)。 GO Visualizerでは、ユーザーはインタラクティブに階層を拡張したりビューを変更したりすることができる。これはAmiGOや他の既存のGO Webツールが提供する静止画よりも有利である。次に、6つのスコアリングスキームを取り入れることによって、インタラクティブなGO関係分析とGOの類似性/相違の詳細な定量化を提供する。 6つのスコアは、GOトポロジ構造、タンパク質間相互作用(PPI)関連付け、コンテキスト関連付け、およびアノテーション頻度に及ぶ、GO termのさまざまな関係を反映している。特にNaviGOでは、GO termの機能的コヒーレンスを評価するために著者らのグループで以前に開発された3つのスコアリングスキーム、すなわち共起関連スコア(CAS)、Pubmed Associationスコア(PAS)[ref.9]、およびInteraction Association Score(IAS)を実装した。これらはそれぞれ遺伝子アノテーションPubMedの文献抄録、および物理的に相互作用するタンパク質でco-occurすることが観察されているGO termペアの統計に基づいている。これらの3つのスコアリングスキームは、これらの異なる文脈上の関連性に基づいてGO term距離の定量化を可能にし、他の3つの意味的類似性ベースのスコアリングスキームとは異なりドメイン間のGOターム比較を提供する(Resnik、Lin、Relevance Similarity [ref.11];メソッド参照)。第3に、NaviGOでは、さまざまなGOスコアリングスキームを活用して、ユーザーが選択したスコアリングスキームを使用して、遺伝子グループの機能的類似性の定量分析と機能的に類似した遺伝子クラスターの視覚化を提供する。 NaviGOは、遺伝子機能予測ウェブサーバー、PF​​P [12、13](PFP HP)およびESG [8、14](ESG HP)からもリンクされているので、機能予測は容易に分析することができる。

 上記の既存のGOの視覚化および比較ツール[ref.3-7]以外に、特定の遺伝子の生物学的分析に焦点を絞った他のGOベースのツールがある。 GSEAはGOエンリッチメント解析に焦点を当てており、遺伝子アノテーションデータベースとリンクしている[ref.15]。 GeneWeaverは、遺伝子のアノテーション、表現、QTL、GWAS、およびその他の生物学的データを含む、複数の種からの遺伝子のデータリポジトリである[ref.16]。 GeneWeaverに関連するツールは、遺伝子データセットを保存されているデータにリンクさせ、相同性と遺伝子の重複を考慮してデータセットを比較することができる[ref.16]。 DAVIDはアノテーションドメイン構造、および遺伝子のパスウェイ情報を保存し、ユーザーは遺伝子の一般的なGOアノテーションを考慮した遺伝子セットを分類することができる[ref.17]。 VLADは遺伝子のGOエンリッチメント解析を実行し、GO階層上の結果を視覚化する[ref.18]。これらのツールと比較して、NavGOは、GO termの類似性と関連性について複数の異なる定義を提供し、GO termの親の関係を視覚化して伝えることができ、また最先端の機能予測サーバーからリンクできるという点でユニークである。

 全体として、NaviGOはGO の機能的アノテーションの基礎としてGO termを調査し理解するためのツールを提供し、遺伝子のGOアノテーションの生物学的分析のためのツールも提供する。 Webベースのツールに加えて、ソフトウェアのローカル使用のためにソースコードがダウンロード可能である。 NaviGOは、GO termを扱う計算生物学者と遺伝子の機能分析を行う生物学者の両方にとって便利なツールである。

 

 

labo HP

http://kiharalab.org/web/index.php

How to use

http://kiharalab.org/web/navigo/views/help.php

 

使い方

NaviGO にアクセスする。

f:id:kazumaxneo:20190612022809p:plain

各タブから4種類の分析を実行できる。クエリGO termの親termを検索および視覚化するための「GO parents」、クエリGO termの類似性および関連性を計算するための「GO set」、クエリタンパク質のセット中のエンリッチされたGOアノテーションを識別するための「GO Enrichment」、および一連のクエリタンパク質について機能的類似性および関連性分析を行うための「Protein Set」が含まれる。入力として、GO termのリスト(図1a)またはアノテーション付き遺伝子のリスト(図1b)のいずれかを使う。

 

1、GO parents

入力GO termを視覚化し、入力GO termの親GO termをリストするための機能。 ビジュアライゼーションでは、GO termは階層内で太字の黒で囲まれる。 そのGO termの親 termは、視覚化の下のテキスト領域にリストされる。

調べたいGO termを入力してView GO Hierarchyをクリックする。

f:id:kazumaxneo:20190825210442p:plain

結果はインタラクティブに操作可能なグラフとして表示される。入力したGO termは太い黒線のboxになる。一番上はrootのGO、そして順に下の階層に繋がっている。下の表は、入力したGO termの階層構造を示したものになる(上のグラフと同じ)。

f:id:kazumaxneo:20190825210553p:plain

マウス/trackpadで拡大縮小したり、移動できる。

boxをクリックすると、その1つ下の階層のtermが全て展開表示される。色付きのエッジ(矢印)は誘導/抑制などの関係を表す。

f:id:kazumaxneo:20190825211544p:plain

 

2、GO set

2つ以上のGO termを入力し、6つのスコア、Resnikスコア、Linの意味的類似性(LSS)、Relevance Semantic Similarity(RSS)、CAS、PAS、およびIASを使用して類似性を計算できる機能。結果は3つの異なる方法で表示され、「GO Set Result」、「Network Visualization」、および「Multidimensional Scaling Visualization」の3つの異なるページで利用可能になる。

類似性を調べたいGO termのセットを入力する。

f:id:kazumaxneo:20190825212018p:plain

Submitをクリックする。計算が終わるまで少し時間がかかる。

 

結果は3つのタブに分けてまとめられる。

左端のGO set Resultタブ

ページの上部のウィンドウに入力したGO termが出現した回数とともに表示される。出現回数は、たとえば、複数のメソッドからGO term予測を分析する場合に便利になっている(メソッドによって一貫して予測されるtermを簡単に見つけることができるため)。

f:id:kazumaxneo:20190824233232p:plain

下の方の表にはGO termペア(GO term1とGO term2)のスコアがリストされる。 2つのGO termが異なるカテゴリからのものである場合、Resnick、LSS、およびRSSスコアは計算されない。 PAS、CAS、IASは、使用するデータセットに観測値がないためにスコアが計算されなかった場合は表示されない。「CSV形式でテーブルをダウンロード」をクリックすると、結果のテーブルをCSV形式でダウンロードできる。

 

ページの上の方にあるOpen BP ビジュアライザーをクリックするとBP ビジュアライザーが起動し、調べているGO termとその親 termがグラフ表示される。 「vis」ボタンをクリックすると2つの termが視覚化され、右端の列の「parents」をクリックすると一般的な親の termが表示される。

f:id:kazumaxneo:20190824233410p:plain

Adobe  FLASHが必要。 

 

中央のNetwork Visualizationタブ

入力したGO term間の類似性がネットワークで表示される。標準ではResnickの結果を示している。

f:id:kazumaxneo:20190824233437p:plain

左上のメニューから切り替え可能になっている。右端にはsimilarity cutoffをその場で変更するバーもある。

f:id:kazumaxneo:20190825214540p:plain

 

右端のMultidimensional Scaling

GO termの類似性が、2つのスコア(説明)を使用して2次元パネルに視覚化される。

f:id:kazumaxneo:20190824233459p:plain

右側のパネルでGO termをクリックすると、マップ内のGO termの位置が示される。

 

 

3、GO Enrichment

GO term enrichment解析が実行され、そのp値が計算される。NaviGOは、1列目に入力するタンパク質のUniProt IDに基づいて生物を自動的に識別できるが、生物指定のウィンドウに生物を指定することもできる。サーバーは、RESTfulサービスを介してUniprotデータベースに接続し、生物情報を自動的に取得する。

f:id:kazumaxneo:20190825212023p:plain

 

 

結果ページには、計算されたp値でソートされたGO termが一覧表示される。 p値は、セット内のタンパク質の数、生物内のそのGO termを持つタンパク質の数、および生物。有意なp値のGO(または上位30のGOのいずれか小さい方)がGO階層で視覚化される。
f:id:kazumaxneo:20190825213202p:plain視覚化するGO term数は、ユーザーが手動で制御できる。エンリッチされたGO termは、GO DAGビジュアライザーの強化のp値に従ってカラーマッピングされる(

GO termは外部データベースとリンクされているようだが、リンク切れしていた)。

 

 

4、Protein Set

タンパク質の機能的類似性/関連性を8つの異なるスコアで計算する。

f:id:kazumaxneo:20190825212044p:plain

 

  Protein Setの結果

f:id:kazumaxneo:20190825213911p:plain

 

引用
NaviGO: interactive tool for visualization and functional similarity and coherence analysis with gene ontology
Qing Wei, Ishita K. Khan, Ziyun Ding, Satwica Yerneni, Daisuke Kihara

BMC Bioinformatics. 2017; 18: 177


Computing and Visualizing Gene Function Similarity and Coherence with NaviGO

Ding Z, Wei Q, Kihara D

Methods Mol Biol. 2018;1807:113-130

 

関連