macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

共通/非共通の要素をベン図で視覚化し、抽出する jvenn

 

ハイスループットの生物学は、ますます複雑な実験計画で、データの数を増やしている。これらのデータの分析では、多くの場合、遺伝子名やOTU(Operational Taxonomic Unit)を含む生物学的識別子のリストが生成される。これらは異なる方法(微分分析)または異なる実験条件から取得される。ベン図[ref.1]は一般的な視覚化チャートであり、リストの類似性に関する洞察を提供する共有識別子と非共有識別子を見つけることができる。

 ベン図では、各リストは透明な形で表示される。シェイプのオーバーラップには、リスト間で共有される要素、またはより頻繁に対応するカウントが含まれる。比例ベン図では、形状のサイズは、対応するリストまたは対応するリストの共通部分の要素の数に比例する。最大4つのリストを持つベン図は読みやすく、理解しやすいが、4つを超えるリストを持つベン図は解釈がはるかに困難である。この問題を解決するために、Edwards-Venn [ref.2]表現では、論文図1の例に示すように、より明確なビューを提供する新しい形状が導入されている。
 多くのベン図ソフトウェアパッケージがすでに利用可能である。論文表1の最初の6行は、主な機能(入力リストの最大数、入力データ形式、ベン図レイアウト、アプリケーションタイプ、および出力形式)を含む主要なパッケージを示している。この表は、ベン図の作成のいくつかの側面に関する洞察を提供し、これまで、Webアプリケーションが最大6つのリストを処理しなかったことを強調している。 VENNTURE [ref.3]は、このようなダイアグラムを作成できる唯一のアプリケーションだが、Edwardsレイアウトのみを実装し、MS-Windows OSでのみ実行され、静的なMS-PowerPointおよびMS-Excelファイルを作成する。比例ベン図では、非常に限られた数のリスト(最大3つ)しか表示できない。 jvennにはない他のソフトウェアで利用できる唯一の機能は、比例図である。これは、jvennが最大6つのリストを表示するように設計されており、比例図が3つを超えるリストを視覚化するのに適していないという事実によって正当化される。
 ここではjQueryプラグインとして開発されたJavaScriptライブラリであるjvenn [ref.9]を紹介する。これには、ダイアグラムの作成を容易にし、読みやすさを向上させる多くの機能が含まれている。特に、jvennは最大6つのリストを処理でき、動的なツールであり、比例レイアウトとEdwardsレイアウトの両方を実装している。このライブラリはすでに2つの文献で使用され引用されている[ef.10、11](論文執筆時点)。 nG6 [ref.12]、RNAbrowse [ref.13]、WallProtDB [ref.14]などのさまざまなWebアプリケーションに既に組み込まれている。

 

manual

http://jvenn.toulouse.inra.fr/app/usermanual.html


使い方

http://jvenn.toulouse.inra.fr/app/index.html にアクセスする。

f:id:kazumaxneo:20191002125707p:plain

 

 

ここではLoad Exampleからデモデータを表示してみる。

http://jvenn.toulouse.inra.fr/app/example.html

f:id:kazumaxneo:20191002131426p:plain

 

右上のLoad Exampleボタン(青色)をクリックしてデモデータを読み込み。

f:id:kazumaxneo:20191002131614p:plain

拡大した。exampleではあるデータについて、DEseq2やTMMで取り出した発現変動遺伝子群(DEGs)の6グループをベン図に視覚化している。大部分は共通だが、一部のDEGは共通していないことが分かる。

 f:id:kazumaxneo:20191002132122p:plain

 

パラメータから表示方法を切り替えられる。Edwardsかclassicに表示を切り替え可能。

f:id:kazumaxneo:20191002131808p:plain

DESEQ2とTMMのみ表示。

f:id:kazumaxneo:20191002133107p:plain



ダウンロード。

f:id:kazumaxneo:20191002132848p:plain

 

 

パラメータウィンドウのFind~ の空欄からG0005を含む要素の場所を検索。

f:id:kazumaxneo:20191002132011p:plain

その遺伝子を含む要素がbold fontで強調表示される。

 

 

ベン図の要素数をクリックすると、そのリストが下のウィンドウに表示される。

f:id:kazumaxneo:20191002132702p:plain

特定のグループのみ取り出したい時に便利ですね。

引用

jvenn: an interactive Venn diagram viewer
Philippe Bardou, Jérôme Mariette, Frédéric Escudié, Christophe Djemiel, Christophe Klopp

Published online 2014 Aug 29. BMC Bioinformatics. 2014; 15(1): 293.

 

関連