macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

非モデル生物のエンリッチメント解析ツール getENRICH

 

 遺伝子オントロジーGene Ontology)システムは、遺伝子を特定の生物学的プロセス、細胞構成要素、および分子機能に分類することで、遺伝子の機能的注釈付けを容易にする。DAVIDやEnrichrなど多くのツールが存在するものの、非モデル生物の解析は遺伝情報や利用可能なツールの不足により依然として困難である。これに対応するために、非モデル生物向けの遺伝子エンリッチメント解析に特化した包括的ツールであるgetENRICHを開発した。コマンドライン版とウェブベースのグラフィカルユーザーインターフェースGUI)版の両方が利用可能で、遺伝子データセットのアップロード、パラメータ設定、可視化をユーザーフレンドリーに行える。getENRICHはP値の計算に超幾何分布を用い、多重検定には Benjamini–Hochberg補正を採用している。getENRICHはMITライセンスのもとで無償提供されており、ソースコード、ドキュメント、サンプルデータセットGitHubhttps://github.com/jnarayan81/getENRICH)で公開されている。GUI版は https://getenrich.igib.res.in/ から利用できる。

 

Documentation

https://getenrich.igib.res.in/assets/files/getENRICH-documentation.pdf

 

Github

 

Workflow

 

実行方法

ここではGUI版(webリソース)を紹介します。

https://getenrich.igib.res.in/にアクセスする。

Get startedをクリック

 

このページにジャンプする。

https://getenrich.igib.res.in/app/

 

ファイルのアップロード:「Submit Job」タブを使って、バックグランド遺伝子ファイル(.txt/.tsv)、関心のある遺伝子ファイル(.txt/.tsv)、KEGG注釈ファイル(.txt/.tsv)を順番にアップロードする。

おそらくインドの大学にサーバーがあるので、日本からだとアップロード/ダウンロードには少し時間がかかる。

 

それぞれのデモデータは左のメニューの Download Sample Filesからダウンロードできる。

以下のファイルとなる。

ko_background_genes.txt

 

ko_genes_of_interest.txt

 

ko_kegg_annotation.txt

 

オプションの設定

必要に応じて除外するパスウェイを選択できる。複数選択可能

 

Significance Threshold、Plotting Strategy(視覚化方法)を選択できる。その下のDetailed Plot Selection (Overrides Strategy Above)は、Plotting Strategyを詳細に選択できるもので、Plotting Strategyの設定は上書きされる。

 

右下のPrepare KEGG annotationをクリックするとblastKOALAやKAAS、eggNOG-emapper出力ファイルからgetENRICH向けのKEGGアノテーションファイルに変換することができる機能に移動する。

変換後、処理済みの出力ファイルをダウンロードしてジョブに使用する。

 

メールアドレスを入力し、「Start Analysis」をクリック

 

発行されたjob IDを記録しておく。


 結果は、上のCheck Resultsタブをクリックし、Check Results画面でジョブIDを入力して問い合わせる。

”Job is pending... Please wait.”

 

Pendingは0だったが結果が出るまで4時間ほどかかった。

 

出力例

Enrichment KEGG Results

 

P-Value Based Visualizations

 

クリックすると展開される。

Network Plot (Interactive HTML)

Heatmap Visualization (PDF)

PubMed Trend Plot

Tree Plot

Upset Plot

KEGG Pathways (P-Value)

(この後も続く)

 

P-Adjust Based Visualizations

 

About & References

 

全ての結果はzip形式でダウンロードできる。

 

ダウンロードして解凍した。

enrichment_KEGG_results.csv

graph/

pathway/p_adjusted_pathwawy/ 

 

引用

getENRICH: a tool for the gene and pathway enrichment analysis of non-model organisms

Ajay Bhatia , Pranjal Pruthi , Isha Chakraborty , Nityendra Shukla , Jitendra Narayan

Bioinformatics Advances, Volume 5, Issue 1, 2025

 

関連