macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ネットワークベースのパスウェイアノテーションのためのウェブサーバー PathBIX

 

パスウェイアノテーションは、生命科学における実験データを解釈し、意味を与えるための重要なツールである。このタスクのために数多くのツールが存在するが、最新世代のパスウェイエンリッチメント解析ツールであるネットワークベース法は、単に遺伝子の内容だけでなく、解析の基礎となるより豊富な情報源を得るために生物学的ネットワークを利用するものである。ネットワークベースの手法は、クエリー遺伝子セットと既知のパスウェイの遺伝子との間のネットワーククロストークを使用し、これをランダムな期待値のヌルモデルと比較する。

著者らは、最近発表されたANUBIXアルゴリズムに基づいて、ネットワークベースのパスウェイ解析のための新しいWebアプリケーションであるPathBIXを開発した。PathBIXは、21種の生物種についてパスウェイアノテーションを行い、FunCoup 5.0ネットワークからプリフェッチ・前処理したネットワークデータと3つのデータベースからのパスウェイデータを利用する。KEGG、Reactome、WikiPathwaysの3つのデータベースからのパスウェイデータを利用している。

 

 

webサービス

https://pathbix.sbc.su.se/にアクセスする。

 

生物種を21種から選ぶ。ヒトやマウス、線虫、イーストなど代表的なモデル生物に対応している。

 

使用するパスウェイデータベースを選択する。

 

Examples-drop-down list で遺伝子セットを選択すると、

Genes 入力フィールドに各生物種のあらかじめ選択された遺伝子セットが自動入力される。

例を使用しない場合は、Genesフィールドにクエリとしたい遺伝子セットをスペース区切りで入力する。

 

クラスタリングを適用する場合は、入力フォームの下にあるApply Clustering-チェックボックスを選択する。多くの場合、遺伝子セットはノイズが多かったり、複数のパスウェイに関連しているため、エンリッチメントの結果が弱くなる。この新しいクラスタリング実装は、遺伝子セットを異なるモジュールにクラスタリングし、それらを別々に実行することによって、遺伝子セットの不均一性を捕らえることができ、解析の感度を高めることを目的としている。このオプションを選択すると、解析の実行時間が最大で数分増加する。このオプションを選択すると、エンリッチされたパスウェイはそのトップスコアリングモジュールとともに表示される(マニュアルより)。

 

ネットワークカットオフ値を高くすると、信頼性の高いリンクを含む疎なネットワークが表示され、低くすると、信頼性の低いリンクを含む大きなネットワークが表示される(マニュアルより)。

最後にsubmitをクリック。

 

出力例

クエリ遺伝子に対してエンリッチされたパスウェイは、結果ページの中央にあるパスウェイテーブルに表示される。右側の色付きの短い四角形は、見つかった各パスウェイに対する各クエリ遺伝子のクロストークを示す。色の濃さはクロストークが大きいほど大きくなる。

デフォルトでは FDRが低いパスウェイが上位になるようにソートされている。

デフォルトで0.05以下の family-wise error rate (FWER) を持つパスウェイがFWERが低い順に表示されている。左のメニューからFDRに切り替えることもできる。カットオフ値は左のメニューから調整できる。また、短い四角形の色は、観察されたクロストークに対する遺伝子クロストーク、遺伝子ごとの総リンクに対する遺伝子クロストーク、または絶対クロストークのいずれかによってカラーリングを変更できる(論文より)。

 

左のメニューから、P値、FDRおよびFWER、さらに標準的なGene Enrichment Analysis(GEA)とPathBIX結果の表示のON/OFFを切り替えできる。

標準的なGSAの結果と比較して議論できるのは便利だと思われる。

 

1つ開いてみる。クエリの遺伝子と関連性のあるパスウェイの遺伝子のクロストークがネットワークで可視化される。

 

カーソルを合わせるとその遺伝子ノードとつながりがあるノードがハイライトされる。また、遺伝子の識別子や説明などの追加情報を見ることができる。

 

左側にあるKEGGとFunCoupボタンをクリックするとKEGGとFunCoupの該当ページにジャンプする。

KEGG

 

 

FunCoup (https://funcoup.sbc.su.se) は、遺伝子/タンパク質の最も包括的な機能的関連付けネットワークの1つ。

 

 

論文では、PathBIXの機能のデモンストレーションとして、148個の原発乳がんサンプルの15%以上でコピー数異常の増加が観察された28個の遺伝子をクエリとした時の分析結果が説明されています。ガン関連のパスウェイや関連性が疑われる遺伝子が見つかり、機能的である事が実証されているようです。詳しくは論文を読んで下さい。

引用

PathBIX—a web server for network-based pathway annotation with adaptive null models 
Miguel Castresana-Aguirre, Emma Persson, Erik L L Sonnhammer
Bioinformatics Advances, Volume 1, Issue 1, 2021, vbab010