2020 9/6 誤解を招く説明を修正
1回目の続きになります。今回はEnrichment のツールを簡単に紹介していきます。
Enrichment
2つのアプリケーションが利用できる。
解析フローはこの手順を踏襲したものになっている。こちらを読めばどんなコマンドを実行しているのかは理解できる。
https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/
1、clusterProfiler(GSEA)
Gene Set Enrichment Analysisのためのアプリケーションになる。
exampleデータ。DEseq2の出力そのままになっている。Deseq2Shinyの解析で得られた結果をフィルタリング等せずそのままアップロードすればよい。
log2FCのカラムを使うので、アップロードしたテーブルのどの列がlog2FCなのかを指定する。
左は遺伝子名の列を指定する。
次に生物名とGene IDのタイプなどを指定する。ExampleデータはFly。keytypeはENSEMBL。
カテゴリとP-value、pAdjustMethod:も注意する。デフォルトではpAdjustMethod:は無しになっている。
Create gseGO objectで解析をスタートする。
結果
左のメニューから分析項目を選択する。
GO PLots
表示数のみ変更可能。10 => 20
KEGG Plots
Pathview Plot
表示するパスウェイを選択する。
ボタンを押すとそのパスウェイが描画される。緑が抑制、赤が誘導。
解析に直接は関係ないが、PubmedのGO termトレンドをみる機能もある。
2010 から2020のまでGO term; cell matrix adhensionのPubmed articlesの頻度。
2、clusterProfiler(ORA)
Over-Representation Analysisを行う。
1と同じようにDEseq2の解析で得られた結果をアップロードする。
下はexampleデータを選択したところ。DEseq2の出力そのままだが、padjでフィルタリングする項目がある。ここはpadjのカラムがどの列番号なのかを指定する。
出力
GO plot
KEGG plot
Pathview Plot
引用
NASQAR: a web-based platform for high-throughput sequencing data analysis and visualization
Ayman Yousif, Nizar Drou, Jillian Rowe, Mohammed Khalfan , Kristin C Gunsalus
BMC Bioinformatics. 2020 Jun 29;21(1):267
NASQAR: A web-based platform for High-throughput sequencing data analysis and visualization
Ayman Yousif, Nizar Drou, Jillian Rowe, Mohammed Khalfan, Kristin C. Gunsalus
bioRxiv 709980
参考
bioinformatics - パスウェイ解析
https://bi.biopapyrus.jp/pathway/