2020 9/6 誤解を招く説明を修正
1回目の続きになります。今回はEnrichment のツールを簡単に紹介していきます。
Enrichment
2つのアプリケーションが利用できる。

解析フローはこの手順を踏襲したものになっている。こちらを読めばどんなコマンドを実行しているのかは理解できる。
https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/
1、clusterProfiler(GSEA)
Gene Set Enrichment Analysisのためのアプリケーションになる。

exampleデータ。DEseq2の出力そのままになっている。Deseq2Shinyの解析で得られた結果をフィルタリング等せずそのままアップロードすればよい。

log2FCのカラムを使うので、アップロードしたテーブルのどの列がlog2FCなのかを指定する。

左は遺伝子名の列を指定する。
次に生物名とGene IDのタイプなどを指定する。ExampleデータはFly。keytypeはENSEMBL。

カテゴリとP-value、pAdjustMethod:も注意する。デフォルトではpAdjustMethod:は無しになっている。

Create gseGO objectで解析をスタートする。
結果

左のメニューから分析項目を選択する。
GO PLots



表示数のみ変更可能。10 => 20

KEGG Plots



Pathview Plot

表示するパスウェイを選択する。

ボタンを押すとそのパスウェイが描画される。緑が抑制、赤が誘導。

解析に直接は関係ないが、PubmedのGO termトレンドをみる機能もある。
2010 から2020のまでGO term; cell matrix adhensionのPubmed articlesの頻度。

2、clusterProfiler(ORA)
Over-Representation Analysisを行う。
1と同じようにDEseq2の解析で得られた結果をアップロードする。
下はexampleデータを選択したところ。DEseq2の出力そのままだが、padjでフィルタリングする項目がある。ここはpadjのカラムがどの列番号なのかを指定する。

出力

GO plot



KEGG plot


Pathview Plot

引用
NASQAR: a web-based platform for high-throughput sequencing data analysis and visualization
Ayman Yousif, Nizar Drou, Jillian Rowe, Mohammed Khalfan , Kristin C Gunsalus
BMC Bioinformatics. 2020 Jun 29;21(1):267
NASQAR: A web-based platform for High-throughput sequencing data analysis and visualization
Ayman Yousif, Nizar Drou, Jillian Rowe, Mohammed Khalfan, Kristin C. Gunsalus
bioRxiv 709980
参考
bioinformatics - パスウェイ解析
https://bi.biopapyrus.jp/pathway/