macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

GO annotation分析ウェブサービス WEGO2

2020 4/26 タイトル修正

 

 WEGO (Web Gene Ontology Annotation Plot) は、2006年に発表された、GO (Gene Ontology) のアノテーション結果を可視化、比較、プロットするためのシンプルで便利なツールである。ハイスループットシーケンシングの急速な発展とGOの普及により、WEGOは近年の利用者数や引用数の増加に伴い、バージョン2.0へのアップデートを行った。WEGOはGOのアノテーション結果を入力として使用する。GOの標準化されたDAG(Directed Acyclic Graph)構造化語彙システムに基づいて、各GO IDに対応する遺伝子の数を計算し、グラフィカルな形式で表示する。WEGO 2.0のアップデートでは、比較ゲノム解析のためのより効率的で最新のアプローチを提供することを目的として、以下の4つの点に重点を置いている。第一に、これまで3つに制限されていた入力ファイルの数が無制限になり、WEGOは複数のデータセットを解析できるようになった。また、このバージョンでは、ゲノム比較解析のベースラインとして採用できる9つのモデル種のリファレンスデータセットが追加された。さらに、解析プロセスでは、2つのサンプルごとではなく、複数のデータセットに対してカイ二乗検定が行われる。最後に、WEGO 2.0は、従来のWEGOヒストグラムに加えて、GO termのソートされたP値を表示し、それらの有意差を示す追加の出力グラフを提供する。同時に、WEGO 2.0は全く新しいユーザーインターフェースを特徴としている。WEGOは、http://wego.genomics.org.cn で無料で利用できる。

 

Documentation

http://wego.genomics.org.cn/document

 

webサービス

http://wego.genomics.org.cn にアクセスする。

f:id:kazumaxneo:20200425214147p:plain

 

 

入力フォーマットはWEGOネイティブフォーマット、InterProScanテキストフォーマット、Raw/XML出力フォーマット、Gene Ontology Annotationフォーマット(GAF)の5種類対応している。シンプルなWEGOネイティブフォーマットは、1行に1つのアノテーションレコードを持つタブ区切りのテキストファイルである。最初のカラムは遺伝子名、その他のカラムはGOを記載する。遺伝子名は、標準的な遺伝子識別子、アクセッション番号、ユーザー定義の文字列のいずれでも構わない。

f:id:kazumaxneo:20200425215954p:plain

WEGO Native file。web docunemtより。

 

ここではDocunemtで提供されているdemoファイルを指定した。アノテーション情報ソースとしてリファレンスを指定する。ここにない場合、ユーザーがアノテーション情報を提供する事もできる。その場合はGAFフォーマットにまとめた、GO termリストとアノテーションの単一ファイルをアップロードする(詳細はDocunemt参照)。

f:id:kazumaxneo:20200426012240p:plain
demoファイルの場合はフォーマット"WEGO Native file"を選択。submitをクリック。

 

出力

f:id:kazumaxneo:20200426013212p:plain

 

GO tree - アップロードされたファイルに含まれるすべてのGOを階層化表示

f:id:kazumaxneo:20200426013331p:plain

それぞれの行のboxは階層表示されたGO termを表し、左から順に遺伝子番号、アップロードされたデータセットに対するGO termの遺伝子割合、各入力データのピアソンカイ二乗検定のp値(期待される遺伝子数が 5 未満だとMl表示)、GO ID、GO termの説明、そしてこのGOtermへの遺伝子リストのリンクとなる。遺伝子パーセンテージは、アップロードされたデータセットの全遺伝子数に対する、この用語のアノテーションを持つ遺伝子またはその用語の子ノードの数のパーセンテージ。スター記号はp値<0.05の有意な関係を持つGO termに付く。

 

graph表示。

f:id:kazumaxneo:20200426015105p:plain

 

 

引用

WEGO 2.0: a web tool for analyzing and plotting GO annotations, 2018 update
Jia Ye, Yong Zhang, Huihai Cui, Jiawei Liu, Yuqing Wu, Yun Cheng, Huixing Xu, Xingxin Huang, Shengting Li, An Zhou, Xiuqing Zhang, Lars Bolund, Qiang Chen, Jian Wang, Huanming Yang, Lin Fang, Chunmei Shi
Nucleic Acids Research, Volume 46, Issue W1, 2 July 2018, Pages W71–W75