macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

複数の実験で得られた機能的な遺伝子アノテーションを階層的に整理し、視覚的にナビゲートする FunMappOne

 

 オミックスデータの解析において、遺伝子の機能アノテーションは不可欠なステップである。現在、遺伝子群の機能をオントロジーや分子パスウェイなどの高次の表現にまとめるためのデータベースや手法が複数存在する。オミックス実験の結果を機能カテゴリにアノテーションすることは、根本的な制御ダイナミクスを理解するだけでなく、複数の実験条件をより高い抽象度で比較するためにも不可欠である。オミックス実験の機能プロファイルを表現したり、比較したりするためのツールは、すでにいくつか公開されている。しかし、実験の数や濃縮された機能語彙の数が多い場合、グラフで表現しても結果を解釈するのが難しくなる。そのため、高次元であっても結果の解釈を容易にするために、アノテーションをグラフィカルにナビゲートし、さらに要約するインタラクティブでユーザーフレンドリーなツールが必要とされている。
 著者らは、複数の機能アノテーションが持つ固有の階層構造を利用して、エンリッチメント分析で得られた結果をより高いレベルの解釈に要約し、要約された各レベルで遺伝子関連情報をマッピングする手法を開発した。1つまたは複数の実験の機能アノテーションを一度に視覚化できる、ユーザーフレンドリーなグラフィカルインターフェースを構築した。このツールはFunMappOneというR-Shinyアプリケーションとして実装されており、https://github.com/grecolab/FunMappOne で公開されている。
 FunMappOneはR-shinyのグラフィカルなツールで、ヒトやマウスの遺伝子の複数のリストを入力し、オプションでそれらの関連する修飾の大きさを加え、Gene Ontology、Kyoto Encyclopedia of Genes and Genomes、またはReactomeデータベースからエンリッチされたアノテーションを計算し、合理的なグループに整理された機能語彙とパスウェイのインタラクティブなマップを報告する。FunMappOneは、複数の実験を迅速かつ簡便に比較することができ、結果を簡単に解釈することができる。

 

論文表1に、DAVID,Enrichr,ToppGene,g:profiler,clusterProfiler,Goplot,BACA、を含む遺伝子機能解析ツールとFunMappOneの比較を示している。他のツールのほとんどは、KEGGパスウェイ、Reactomeパスウェイ、Gene Ontologyを分析する機能を提供しており、エンリッチメント結果をグラフィックで表示することもできる。Goplotのみが遺伝子関連の値を語彙にマッピングする機能を提供しており、Enrichrとg:profilerはウェブベースのグラフィカルユーザーインターフェースを提供する唯一のツールである。他のツールでは、結果を要約したり、複数の実験から得られた機能プロファイルをクラスター化する機能は提供されていない。著者の知る限り、FunMappOneはこれらの機能を全てユーザーフレンドリーなグラフィックインターフェースで提供する唯一のツールである。

 

Github

 

使い方

Docker image

docker pull grecolab/funmappone:3.5.3
docker run --rm -p 8787:3838 grecolab/funmappone:3.5.3

http://localhost:8787にアクセスする。

 

f:id:kazumaxneo:20210816092357p:plain

https://funmappone.cloud.nanosolveit.eu/でも利用できる。

 

関心のある各実験条件に関連する遺伝子のリストと、それらの修飾情報(例えば、DEGsのfold change値)を含むスプレッドシートファイルを用意する。

example (issues#1)

FunMappOne/Mouse_Test_Data.xlsx at master · Greco-Lab/FunMappOne · GitHub

スプレッドシートには各実験条件のシートが含まれており、条件IDで名付けられている。

f:id:kazumaxneo:20210902003501p:plain

各シートには2つの列があり、それぞれ遺伝子の識別子(Entrez Gene、Gene Symbol、またはEnsembl gene ID)、および任意でそれらの情報を含む。

 

追加のシート"Grouping"も必要で、Groupingにはそれぞれ条件IDと条件グループ情報(番号でグループ化)の2つの列がある。

f:id:kazumaxneo:20210902003615p:plain

 

左上のOrganisumから生物を選択して、準備したスプレッドシートファイルをアップロードする。写真は読み込んだexample データ(mouseを選択している)。

f:id:kazumaxneo:20210902002112p:plain

 

続いて、機能アノテーションGene Ontology - BP、Gene Ontology - CC、Gene Ontology - MF、KEGG、Reactome)の選択、p値補正法とカットオフ値を選択する。発現変動の振幅(fold change, p-value)が提供されている場合、濃縮された語彙の要約値をその値に関連したカラースケールでプロットするか、3色(マイナス、ゼロ、プラス)のみでプロットするかを選択する(後者の機能は、変動の支配的なサインを強調する場合に有用)。

f:id:kazumaxneo:20210902004306p:plain

発現変動の振幅(fold change, p-value)値を含まない遺伝子リストのみをアップロードした場合、エンリッチされた語彙のエンリッチメントP値が表示される。最後にめにゅー右下のGenerate Mapをクリックする。

 

エンリッチされているかどうか計算される。しばらく時間がかかる。

 

出力

f:id:kazumaxneo:20210902011155p:plain

出力する項目は編集できる。

マップを表示するレベルを選択する。

f:id:kazumaxneo:20210902011340p:plain

 

サンプルを選択する。

f:id:kazumaxneo:20210902011355p:plain

 

編集すると、選択したレベルのカテゴリーに対応する行が,レベルの上位のクラスによってグループ化された新しいマップが表示される。

f:id:kazumaxneo:20210902011604p:plain

マップのセルの色は、カテゴリーの行に属する実験条件の列にある、エンリッチされたすべての語彙の値に関連付けられている。

 

似たようなプロファイルを持つ実験条件をクラスタリングして並び替えることもできる。クラスタリング法と距離を選択する。

f:id:kazumaxneo:20210902011753p:plain

クラスタリングタブに切り替えるとデンドログラム表示される。

f:id:kazumaxneo:20210902012250p:plain

 

 

Heatmap genesタブでは遺伝子を視覚化して調べることができる。

f:id:kazumaxneo:20210902012159p:plain

 

引用

FunMappOne: a tool to hierarchically organize and visually navigate functional gene annotations in multiple experiments
Giovanni Scala, Angela Serra, Veer Singh Marwah, Laura Aliisa Saarimäki, Dario Greco
BMC Bioinformatics volume 20, Article number: 79 (2019)