macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Webベースのデータ分析プラットフォーム NASQAR その２

RNA seq GO enrichment analysis GO term 結果の視覚化 (visualization) KEGG KEGG pathway

2020 9/6 誤解を招く説明を修正

1回目の続きになります。今回はEnrichment のツールを簡単に紹介していきます。

Enrichment

２つのアプリケーションが利用できる。

f:id:kazumaxneo:20200905215733p:plain

解析フローはこの手順を踏襲したものになっている。こちらを読めばどんなコマンドを実行しているのかは理解できる。

https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/

１、clusterProfiler(GSEA)

Gene Set Enrichment Analysisのためのアプリケーションになる。

f:id:kazumaxneo:20200905212045p:plain

exampleデータ。DEseq2の出力そのままになっている。Deseq2Shinyの解析で得られた結果をフィルタリング等せずそのままアップロードすればよい。

f:id:kazumaxneo:20200905212048p:plain

log2FCのカラムを使うので、アップロードしたテーブルのどの列がlog2FCなのかを指定する。

f:id:kazumaxneo:20200905212206p:plain

左は遺伝子名の列を指定する。

次に生物名とGene IDのタイプなどを指定する。ExampleデータはFly。keytypeはENSEMBL。

f:id:kazumaxneo:20200905214632p:plain

カテゴリとP-value、pAdjustMethod:も注意する。デフォルトではpAdjustMethod:は無しになっている。

f:id:kazumaxneo:20200905220215p:plain

Create gseGO objectで解析をスタートする。

結果

f:id:kazumaxneo:20200905212312p:plain

左のメニューから分析項目を選択する。

GO PLots

f:id:kazumaxneo:20200905212504p:plain

f:id:kazumaxneo:20200905212507p:plain

f:id:kazumaxneo:20200905212510p:plain

表示数のみ変更可能。10 => 20

f:id:kazumaxneo:20200905212512p:plain

KEGG Plots

f:id:kazumaxneo:20200905212732p:plain

f:id:kazumaxneo:20200905212735p:plain

f:id:kazumaxneo:20200905212737p:plain

Pathview Plot

f:id:kazumaxneo:20200905212917p:plain

表示するパスウェイを選択する。

f:id:kazumaxneo:20200905213258p:plain

ボタンを押すとそのパスウェイが描画される。緑が抑制、赤が誘導。

f:id:kazumaxneo:20200905213014p:plain

解析に直接は関係ないが、PubmedのGO termトレンドをみる機能もある。

2010 から2020のまでGO term; cell matrix adhensionのPubmed articlesの頻度。

f:id:kazumaxneo:20200905214125p:plain

２、clusterProfiler(ORA)

Over-Representation Analysisを行う。

１と同じようにDEseq2の解析で得られた結果をアップロードする。

下はexampleデータを選択したところ。DEseq2の出力そのままだが、padjでフィルタリングする項目がある。ここはpadjのカラムがどの列番号なのかを指定する。

f:id:kazumaxneo:20200905221744p:plain

出力

f:id:kazumaxneo:20200905221850p:plain

GO plot

f:id:kazumaxneo:20200905221943p:plain

f:id:kazumaxneo:20200905221952p:plain

f:id:kazumaxneo:20200905221954p:plain

KEGG plot

f:id:kazumaxneo:20200905222046p:plain

f:id:kazumaxneo:20200905222049p:plain

Pathview Plot

f:id:kazumaxneo:20200905222134p:plain

引用
NASQAR: a web-based platform for high-throughput sequencing data analysis and visualization

Ayman Yousif, Nizar Drou, Jillian Rowe, Mohammed Khalfan , Kristin C Gunsalus

BMC Bioinformatics. 2020 Jun 29;21(1):267

NASQAR: A web-based platform for High-throughput sequencing data analysis and visualization

Ayman Yousif, Nizar Drou, Jillian Rowe, Mohammed Khalfan, Kristin C. Gunsalus

bioRxiv 709980

参考

bioinformatics - パスウェイ解析

https://bi.biopapyrus.jp/pathway/