macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

多様なヒートマップを作図できるwebサービス Heatmapper

2021 1/19 誤字修正

 

 Heatmapperは自由に利用できるWebサーバであり、ユーザーは使いやすいグラフィカルなインターフェースを使って、データをヒートマップの形でインタラクティブに視覚化することができる。既存の非商用のヒートマップパッケージは、グラフィカルなインターフェースを持たないか、1種類または2種類のヒートマップにしか特化していない。これとは異なり、Heatmapperは汎用性の高いツールであり、ユーザは多くの異なるデータタイプやアプリケーションに対応した多種多様なヒートマップを簡単に作成することができる。具体的には、Heatmapperでは以下のようなことが可能である。(i) トランスクリプトーム、プロテオーム、メタボローム実験からの発現ベースのヒートマップ、(ii) ペアワイズ距離マップ、(iii) 相関マップ、(iv) 画像オーバーレイヒートマップ、(v) 経緯・緯度ヒートマップ、(vi) 地政学的(コロプレット)ヒートマップを生成、クラスタ化、可視化できる。Heatmapperには、シンプルで直感的なカスタマイズオプションが多数用意されており、各ヒートマップの外観やプロットパラメータを簡単に調整することができる。また、Heatmapperでは、各ヒートマップセル上にカーソルを置くことで、数値データの値をインタラクティブに探索したり、検索可能/ソート可能なデータテーブルビューを使用したりすることができる。ヒートマップデータは、テキスト、Excel、タブで区切られたフォーマットのテーブルでHeatmapperに簡単にアップロードでき、結果として得られるヒートマップ画像は、PNG、JPG、PDFなどの一般的なフォーマットで簡単にダウンロードできる。Heatmapperは、分子生物学者、構造生物学者微生物学者、疫学者、環境科学者、農林科学者、魚類・野生生物学者、気候学者、地質学者、教育者、学生など、幅広いユーザーを対象に設計されている。Heatmapperは、http://www.heatmapper.caで利用できる。

 

Github

レポジトリではCOVID-19に対応するためのアップデートもあり。

 

できることを簡単に見ていきます。

webサービス

http://www.heatmapper.ca にアクセスする。

f:id:kazumaxneo:20210118233146p:plain

5つの異なるクラスのヒートマップを作成できる。


1、Expression - トランスクリプトーム(マイクロアレイまたはRNAseq)、プロテオームまたはメタボローム実験から得られたクラスタリングされていない(または以前にクラスタリングされた)データを表示

 

タブ区切りのファイルを用意する。下の例では、1列目が遺伝子ID名(重複がない事)、2列目が遺伝子名、3列目以降に発現量となっている。1行目には各列の列名を記載する。

f:id:kazumaxneo:20210118233718p:plain

example format (demo)(メニュー => About => Instructions => Expressionより)

 

demoデータを表示した。

f:id:kazumaxneo:20210118235227p:plain

 

クラスタリング方法(無しもあり)、距離法を指定できる。ヒートマップの色はプリセットかユーザー指定で選べる。

f:id:kazumaxneo:20210118235440p:plain

結果は左下のボタンからダウンロードできます。

 

 

2、Pairwise - ペアワイズ比較ヒートマップ

3種類のフォーマットに対応している。

A、一般的なデータテーブル

  • 拡張子.csvを持つカンマ区切りの値
  • 拡張子.txt、.dat、.tsv、または.tabで区切られたタブ
  • 拡張子が.xlsまたは.xlsxのExcelワークブックの最初のシート

B、PDBファイル

  • RCSB Protein Data Bankで使用されているProtein Data Bankファイル。最初のストランドからの原子座標が使用される。

C、Multi-FASTAファイル

  • マルチFASTA形式のDNA配列セット。各配列のk-mer頻度を計算し、距離行列としてアラインメントフリーの系統解析を行う。

一般的なデータテーブルの例

f:id:kazumaxneo:20210119000349p:plain

最初の行および/または最初の列は、データ・ラベルがあっても良く、なくても良い。両方ともデータ・ラベルを含む場合、左上のセルに何らかのラベル(これは表示されません)が存在しなければならない(example2)。数値データラベルのみが存在する場合は、適切なチェックボックスを選択してラベルとして扱うようにできる。

 

demoデータを表示した。

f:id:kazumaxneo:20210119000527p:plain

 

Pairwiseヒートマップでは、距離行列のヒートマップと、相関行列のヒートマップが作成できる。距離行列のヒートマップでは、ファイルの各行に n 次元空間の点を表す n 個のデータ列(n ≥ 1)が含まれている必要がある。相関ヒートマップでは、互いに相関関係が計算される変数を表す列を持つ,n > 1のn個のデータ列が含まている必要がある。距離行列計算では、入力データは最大300行、500列まで、相関行列計算では、入力データの行数は最大500行、列数は最大300列まで対応している。

メニュー中央のChoose matrix ~から距離行列の計算か相関行列計算かを選ぶ。

f:id:kazumaxneo:20210119002633p:plain

上の図はmulti-fasta(example3)の相関マトリックスのヒートマップ。

 

 

3、Image Overlay - 画像オーバーレイヒートマップ。任意の画像の上にヒートマップを表示

使用可能なファイル形式
背景画像には.jpgまたはjpegpng、tifまたは.tiffTIFF画像を使用できる。
オーバーレイするグリッドデータについては、カンマ区切りの.csv、拡張子.txt、.dat、.tsv、または.tabで区切られたタブファイル、または拡張子が.xlsまたは.xlsxのExcelワークブックの最初のシートが利用できる。

データ構造

グリッドデータは、2つのフォーマットに対応している。

A、ロングフォーマット
グリッドまたは「温度(ヒート)」の値を x および y 座標で指定(下の画像のロングフォーマット例)。x、y、valueの列を持つヘッダー行を含む必要がある。
B、ワイドフォーマット
グリッド値または "温度 "値のみを含み、暗黙のxおよびy座標を持つ。値は,画像にマップされた行列として与えられる(下の画像のワイドフォーマット例)。x、y、valueの列を持つヘッダー行を含む必要がある。ヘッダ行は持たない。

f:id:kazumaxneo:20210119005239p:plain

画像ファイルと、座標とvalueのファイルをアップロードする。

f:id:kazumaxneo:20210119004357p:plain

Aboutの解説では、CT画像と座標ごとの試薬の効果値をオーバーレイ表示する例がある。

 

 

4、Geomap - ジオマップヒートマップ。国、州、州などの政治的境界線に基づいたヒートマップを表示

使用可能なファイル形式
カンマ区切りのcsvファイル、拡張子.txt、.dat、.tsv、または.tabで区切られたタブ区切りファイル、.xlsまたは.xlsxのExcelワークブックの最初のシート。
データ構造
データ入力には、1 列目に地域名(選択したマップに一致する地域の名前 地域名)、2 列目に数値(任意の正または負の数値)を含む少なくとも 2 列を含める必要がある(下のexample)。最大50列まで含めることができる。デフォルトでは、ヒートマップを生成するために2番目の列が選択されているが、ドロップダウンメニューを使用して変更できる。

f:id:kazumaxneo:20210119010934p:plain

example2

f:id:kazumaxneo:20210119010525p:plain

 使用方法についてはマニュアル参照。 

 

5、Geocoordinate - 地理空間座標(緯度・経度)のデータを表示

 

使用可能なファイル形式
カンマ区切りのcsvファイル、拡張子.txt、.dat、.tsv、または.tabで区切られたタブ区切りファイル、.xlsまたは.xlsxのExcelワークブックの最初のシート。

データ構造
データ入力は,有効な緯度経度座標を持つ少なくとも2列を含まなければならない。オプションの3列目には、点の密度に基づいて推定を行う代わりに、重み付き密度推定を計算するための値を含む列を含めることができる。value列が使用される場合、少なくとも1つの値は厳密には0よりも大きくなければならない。最初の行には、各列の名前、"Latitude", "Longitude", (該当する場合は) "Value "を入れなければならない。
範囲
緯度: -180と+180の間の任意の数
経度: -90から+90の間の任意の数値
値:任意の正の数
入力データは最大8,000点のデータポイントを持つことができる。

 

f:id:kazumaxneo:20210119013052p:plain

 

example1

f:id:kazumaxneo:20210119013904p:plain

 

example2

f:id:kazumaxneo:20210119013940p:plain

使用方法についてはマニュアル参照。 

 

引用
Heatmapper: web-enabled heat mapping for all

Sasha Babicki, David Arndt, Ana Marcu, Yongjie Liang, Jason R Grant, Adam Maciejewski , David S Wishart

Nucleic Acids Res. 2016 Jul 8;44(W1):W147-53

 

関連