macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

バリアントエンリッチメント解析を行うshinyサーバー Varanto

 

 ゲノムワイド関連研究(GWAS)は、一塩基多型SNPs)などの遺伝的バリアントと特定の形質や疾患との関連を明らかにすることを目的としている。これらの結果をさらに探求し、解釈するためには、パスウェイ、生物学的プロセス、疾患との関連などの共通テーマを特定することが必要になる。Varantoは、多様なデータソースを用いてヒトの遺伝子バリアントをアノテーションし、可視化し、解析するための新しいWebツールである。Varantoは、入力されたバリアントのセットを照会し、関連するバリアントと遺伝子レベルのアノテーションを取得し、アノテーションのエンリッチメント解析を行い、結果を可視化するために使用できる。

 VarantoのウェブアプリはRで開発され、PostgreSQLデータベースを用いたShinyアプリとして実装されており、http://bioinformatics.uef.fi/varanto、自由に利用することができる。ツールのソースコードhttps://github.com/oqe/varanto で公開されている。 

 

Github


 

webサービス

https://bioinformatics.uef.fi/varanto/にアクセスする。

 

VarantoはEnsemblデータベースとゲノム上のポジションで遺伝子を認識する。識別子は、dbSNPリファレンスSNP識別子(すなわちrs-numbers)を認識する(wiki)。

ID間はスペースキーで区切る。

 

バックグランドセット
(helpより)エンリッチメント分析では、入力セット内のバリエーションにリンクされたアノテーションの過剰発現/過少発現が調べられる。入力セットにリンクされたアノテーションは、デフォルトではデータベース内のすべてのバリエーションで構成されるバックグラウンドセットと比較される。入力セットが、技術的な選択によって検出可能なバリエーションが制限されている実験から得られたものである場合(たとえば、あらかじめ決められたバリエーションを持つSNPマイクロアレイを使用する場合)、適切なバックグラウンド・バリエーション・セットを選択する必要がある。そのため、最も一般的なSNPマイクロアレイがサポートされている(USCS Genome Browserから取得した情報)。

SNPマイクロアレイ実験から得られた入力セットを使用しない場合、バックグラウンドセットとして「All variations」を使用する。

 

距離によるフィルタリング
(helpより)入力セットに複数の近接した変異(単一遺伝子内など)が含まれる場合、その遺伝子座に関連するアノテーションが過剰に表示される問題を回避するために、入力変異セットをゲノム距離でフィルタリングできる。選択すると、その距離内にある1つのバリエーションが選択され、他のバリエーションはフィルタリングされる。

 

バリエーションアノテーション
(helpより)バリエーションアノテーションは、個々のバリエーションに直接リンクされたアノテーションを意味する。これらのアノテーションは、バリエーション自体に関する具体的な情報を提供する。アノテーションは、選択可能な行で一覧表示され、行にはデータリソースの略語(Ens - Ensemble、GET-E - Genotype + Environment = Trait Evidence(GET-Evidence))が括弧内に、アノテーション名とアノテーション用語数が括弧内に表示されている。複数選択可能。

(語彙数の多いアノテーションを選択すると、実行時間が大幅に増加する。)

 

遺伝子アノテーション
(helpより)遺伝子アノテーションは、ある遺伝子と、その遺伝子を介して、その遺伝子内のすべてのバリアントにリンクしているアノテーションである。遺伝子内のすべてのバリエーションが同じ遺伝子アノテーションを持つため、より一般的なアノテーションとなる。アノテーションは選択可能な行で表示され、行にはデータリソースの略語(Ens - Ensemble, GET-E - GET-Evidence, MSigDB - Molecular Signatures Database)が括弧内に、アノテーション名とアノテーション語数が括弧内に表示されている。複数選択可能。

(helpより)遺伝子アノテーションはより一般的で、入力リストのバリエーションが遺伝子や関連現象にあまり影響を与えないような結果が得られることがあります。一方、遺伝子についてはバリエーションよりもはるかに多くの情報が知られているため、遺伝子アノテーションは仮説の生成やバリエーションセットの全体的な検査に有用です。遺伝子アノテーションを使用する場合、同じ遺伝子内のバリエーションをフィルタリングするために、「距離によるバリエーションのフィルタリング」オプションを使用することがしばしば推奨される。

 

一番下のSubmitを押して解析する。

 

入力されたバリアントが正しく分析されると、下に入力セット内のバリエーションとそれらに関する一般的な情報(バリエーションID、鎖、位置、アレル、染色体)からなるアノテーション結果のテーブルが表示される。

 

 

enrichment解析

入力バリエーションセットで実行されたエンリッチメント解析の結果のテーブル。

テーブルには、選択したバックグラウンドバリエーションセットと比較した場合の、入力バリエーションセット内の関連アノテーションの過剰存在と過小存在に関する情報が含まれている。左端には統計的検定からのP値と多重検定の補正後のFDRが示されている。

 

heatmapタブ

 

karyogramタブ

 

引用

Varanto: variant enrichment analysis and annotation 
Oskari Timonen, Mikko Särkkä, Tibor Fülöp, Anton Mattsson, Juha Kekäläinen, Jussi Paananen
Bioinformatics, Volume 35, Issue 17, 1 September 2019, Pages 3154–3156