macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

インタラクティブなGOエンリッチメント解析webサービス ShinyGO

2019年最後の投稿になります。今年もお世話になりました。来年もどうぞよろしくお願い致します。

 

 ゲノムワイドな研究で特定された一連の遺伝子について、遺伝子オントロジー(GO)によって定義されたものなど、特定のパスウェイまたは機能カテゴリの遺伝子がエンリッチされているかどうかを調べるためエンリッチメント解析を行うことができる(Ashburner et al 、2000)。エンリッチメント解析用に多数のツールが開発された(Khatri et al、2012)。これらのツールの小さなサブセットがSupp table.1にリストされている。一部のツールは生物医学研究用に設計されているため、主にヒトとマウスに焦点を当てている。たとえば、Enrichr(Kuleshov et al、2016)には、GO、共発現、組織特異的遺伝子、転写因子(TF)またはmicroRNA(miRNA)標的遺伝子からさまざまなパスウェイデータベースに至るまでの遺伝子セットが含まれている。同様に、PlantGSEAなどのツールは15の植物種に焦点を当てている(Yi、et al、2013)。
g:Profilerは、300を超える植物および動物種のEnsemblの遺伝子アノテーション(Aken et al、2017)に基づいている。 STRING(Szklarczyk et al、2015)は、タンパク質間相互作用(PPI)の大規模なデータベースである。また、5090種(バージョン11)のGOおよびタンパク質ドメインのエンリッチメント解析機能も提供する。もう一方の極端な例は、DAVID(Huang da et al、2009)であり、NCBI、UniProt、KEGG、GO、Biocarta、REACTOMEなどの多くのソースから情報を取得するため、数万の生物の大規模なデータベースを含めることができる。これらのツールは、生物学者が遺伝子リストから洞察を得るのに役立つ。
 視覚化と統計分析のための多くの強力なRパッケージへのアクセスを可能にするShinyフレームワークを利用して、Ensemblとパスウェイのアノテーションデータベースに基づく新しいツールを開発した。 ShinyGOのユニークな機能には、1)KEGGおよびSTRINGへのAPIアクセスに基づいて、パスウェイダイアグラムおよびタンパク質-タンパク質相互作用(PPI)ネットワークにクエリ遺伝子を表示する、2)階層的クラスタリングおよび対話型ネットワークを使用してエンリッチされたパスウェイ間のオーバーラップを視覚化する、および3)遺伝子の種類、長さ、GC含有量、クエリ遺伝子とバックグラウンドの間のクロモソーム分布の統計的に有意な違いを特定する。いくつかのモデル生物について、他の遺伝子セット、特にTFおよびmiRNA標的遺伝子を組み込むことにより、アノテーションデータベースも強化した。
 詳細については、補足ファイルを参照。ソースコードidep/shinyapps/go at master · iDEP-SDSU/idep · GitHubから入手できる。

 

Github

 


webサービス

http://bioinformatics.sdstate.edu/go/にアクセスする。

f:id:kazumaxneo:20191228231604p:plain

iDEPとほぼ同じインターフェイスなので、iDEPに慣れているとすぐ使い始めることができる。

================参考================

iDEP webサーバーのDEG2タブからもリンクしている。

f:id:kazumaxneo:20191229113725p:plain

左下のShinyGOからリンクしている(直接データが読み込まれるわけではない)。

=====================================================

 

Speciesを選択し、遺伝子リストをペーストする。ここではDemo genesをペーストした。Speciesを選択しないと、ベストマッチの生物種が画面左下に表示される。

f:id:kazumaxneo:20191228231706p:plain

p-value cutoff値と表示する遺伝子数を指定してSubmitをクリック。

 

iDEPで発現変動遺伝子群を絞り込んでいるなら、DEG1タブのGene listsをダウンロードする。

f:id:kazumaxneo:20200109200425p:plain

(iDEP webサービスより)

ダウンロードしたファイルは1行目コメント、2行目誘導遺伝子群、3行目抑制遺伝子群とそれぞれ遺伝子名が横一列にずらっと並んでいるが、横1列全てコピーし、そのままShinyGOのウィンドウにペーストすればOK。

 

その場ですぐにエンリッチされた機能カテゴリが表示される。

f:id:kazumaxneo:20191228233116p:plain

 

左のタブからカテゴリを変更可能。変更するとすぐさま更新される。

f:id:kazumaxneo:20191229111554p:plain

 

REACTOME、pfam、interpro、KEGGなどGOのデータベース以外も選べる。素晴らしい!

f:id:kazumaxneo:20200410183529p:plain

 

hierarchical clustering tree

f:id:kazumaxneo:20191228233121p:plain

Network

f:id:kazumaxneo:20191228233129p:plain

 

クロモソーム毎の遺伝子数、遺伝子タイプ(IncRNA, miRNA, snRNA...)などのグラフf:id:kazumaxneo:20191229104532p:plain

 

locus 

f:id:kazumaxneo:20191229104818p:plain

プロモーター配列

f:id:kazumaxneo:20191229104824p:plain


STRINGとの連携によるprotein-protein network分析。

f:id:kazumaxneo:20191229104830p:plain


PPI network of DEGs

f:id:kazumaxneo:20191229111110p:plain

Click here~からSTRINGにジャンプできる。

f:id:kazumaxneo:20191229111127p:plain

f:id:kazumaxneo:20191229111202p:plain

 

右端の?タブがhelpになっており、データソースなど確認できる。

f:id:kazumaxneo:20191229105747p:plain

 

引用

ShinyGO: a graphical enrichment tool for animals and plants
Steven Xijin Ge, Dongmin Jung, Runan Yao
Bioinformatics, btz931, Published: 27 December 2019

 

関連