macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

包括的な遺伝子セットのエンリッチメント解析ウェブサーバー Enrichr

 

 エンリッチメント解析は、ゲノムワイド実験で得られた遺伝子セットを解析するための一般的な手法である。ここでは、Enrichrと呼ばれるこの分野のツールの1つを大幅に更新した。Enrichrには、現在、解析やダウンロードが可能な多様な遺伝子セットライブラリの大規模なコレクションが含まれている。Enrichrは現在、102の遺伝子セットライブラリから180 184のアノテーションされた遺伝子セットを含んでいる。Enrichrには、ファジーセットの送信機能、BEDファイルのアップロード、アプリケーション・プログラミング・インターフェースの改善、クラスターグラムとしての結果の視覚化などの新機能が追加されている。Enrichrは、キュレーションされた遺伝子セットの包括的なリソースであり、さらなる生物学的発見のために生物学的知識を蓄積する検索エンジンでもある。Enrichrは次のサイトで自由に利用できる: http://amp.pharm.mssm.edu/Enrichr.

 

help

https://maayanlab.cloud/Enrichr/help#basics

 

webサービス

https://maayanlab.cloud/Enrichr/にアクセスする。ヒトとマウス(M. musculus)に対応している。

f:id:kazumaxneo:20211212005959p:plain

D. melanogasterC. elegansS. cerevisiaeD. rerioにも対応している。

https://maayanlab.cloud/modEnrichr/

f:id:kazumaxneo:20211213085937p:plain

 

Entrez遺伝子シンボルのセットをテキストボックスにペーストする。各遺伝子シンボルは1行ずつ入力する。ここではExampleのSTAT3データを指定した(変動遺伝子TOP100 )。

f:id:kazumaxneo:20211213090640p:plain

 

 

 

大規模なデータセットの発現行列と比較して共発現している遺伝子のエンリッチメント解析を行う。ここではARCHS4(ヒトとマウスの公開RNA-seqデータの大部分を均一な条件で解析して公開している)を指定。

f:id:kazumaxneo:20211213090743p:plain

submitをクリック。

出力例

結果ページでは、分析結果が充実したカテゴリーに分けて表示される。左端はTranscriptionのタブになっている。

f:id:kazumaxneo:20211213204154p:plain

結果ページにある各エンリッチメント・タームは、その遺伝子セット・ライブラリによって構成されている。これらのライブラリは、発表された研究や主要な生物学的および生物医学的オンラインデータベースなどの多くの情報源から構築されている。Enrichrのために作成され、Enrichrでしか利用できないものもある。

 

Transcriptionのタブでは、転写の調節に関わる遺伝子セットライブラリのエンリッチメント解析がリストアップされている。

f:id:kazumaxneo:20211213204658p:plain

 

クリックすると展開される。ちなみに、モバイル端末では左右のスワイプで表示内容を切り替えることができる。

Bar Graph

f:id:kazumaxneo:20211213204954p:plain

棒グラフの長さは、その特定の遺伝子セットや用語の重要性を表している。色の明るさも同じで、色が明るいほどその用語の重要性が高いことを示している。初期設定では、すべてのフィギュアの配色が赤になっているが、歯車アイコンをクリックするとカラーピッカーが表示され、配色を変更することができる(棒グラフ、Clustergramのグリッド、ネットワークに対応)。

 

Table

f:id:kazumaxneo:20211213205013p:plain

Enrichrでは、エンリッチメント結果を報告するために4つのスコア:p-value、q-value、rank (Z-score)、およびcombined scoreを実装しているが(詳細はbackgroundについて)、データテーブルではこれらのデータの一部を見ることができる。特定の用語を検索して結果をフィルタリングすることもできる。

 

Clustergram

f:id:kazumaxneo:20211213204942p:plain

グリッドの各マスは用語を表し、他の用語との遺伝子セットの類似性に基づいて配置されている。マス目が明るいほどその用語の重要度が高いことを意味している。。グリッドをクリックすると、隣接する用語との相関スコアに基づいてグリッドを着色し、有意な用語を白いドットで表す別の表示に切り替えることができる。

 

Enrichrでは、結果を他の人と簡単に共有することができるようになっている。それには、左のメニューボックスの共有アイコンをクリックする。これにより、分析結果への一時的なダイレクトリンクが提供され、他の人と共有することができる。

f:id:kazumaxneo:20211213211454p:plain

 

    Appyter

f:id:kazumaxneo:20211213205139p:plain

 

Enrichr Appyterを使用すると、エンリッチメント解析の結果をすぐに公開できるようなビジュアライゼーションを作成できる。

Appyter使用例

f:id:kazumaxneo:20211213205337p:plain

f:id:kazumaxneo:20211213205434p:plain

f:id:kazumaxneo:20211213205401p:plain

f:id:kazumaxneo:20211213205415p:plain

(Appytersカタログは、生物医学研究者がデータを様々な方法で分析し、視覚化することを可能にするソフトウェアプラットフォーム)

 

左から2番目のタブはPathwayとなっている。KEGGPanther、Wikipathway、Reactomeなどの結果が表示される。

f:id:kazumaxneo:20211213205713p:plain

KEGG Human

f:id:kazumaxneo:20211213205731p:plain

 

左から3番目のタブはOntologies。GOなどがある。

f:id:kazumaxneo:20211213205803p:plain

4番目のタブはDiseases。ClinVarやCOVID-19などがある。

f:id:kazumaxneo:20211213205948p:plain

 

5番目のタブはcell type。

f:id:kazumaxneo:20211213210537p:plain

 

6番目のタブはmisc (多種類)。

f:id:kazumaxneo:20211213210636p:plain

 

7番目のタブはlegacy。KEGG2016などがある。

f:id:kazumaxneo:20211213210805p:plain

 

右端のタブはCrowd(雑多、混ぜ物)。

f:id:kazumaxneo:20211213210953p:plain

 

Enrichrでは、ユーザーアカウントを登録してログインすることもできる。アカウントを持つことで、結果をEnrichrサーバーに永久保存することができ、再アップロードの必要なくセットに戻ることができる。使用するには、ログイン後、セットを保存または共有ボタンをクリックする。これにより、自動的にアカウントと関連付けられる(helpより)。

引用
Enrichr: a comprehensive gene set enrichment analysis web server 2016 update
Maxim V. Kuleshov, Matthew R. Jones, Andrew D. Rouillard, Nicolas F. Fernandez, Qiaonan Duan, Zichen Wang, Simon Koplev, Sherry L. Jenkins, Kathleen M. Jagodnik, Alexander Lachmann, Michael G. McDermott, Caroline D. Monteiro, Gregory W. Gundersen, Avi Ma'ayan

Nucleic Acids Res. 2016 Jul 8; 44(Web Server issue): W90–W97

 

Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool
Edward Y Chen, Christopher M Tan, Yan Kou, Qiaonan Duan, Zichen Wang, Gabriela Vaz Meirelles, Neil R Clark, Avi Ma'ayan

BMC Bioinformatics. 2013 Apr 15;14:128