近年のハイスループットなオミックス技術により、大量の生物学的データが生み出されている。このようなビッグオミックスデータを可視化することは、様々な生物学的問題に答えるために必要不可欠である。簡潔でありながら包括的な戦略として、ヒートマップは高次元で異質な生体分子発現データを解析し、魅力的なアートワークで可視化することができる。2014年、本著者らはヒートマップイラストレーションのために3つのクラスタリング手法と7つの距離メトリックを実装したスタンドアローンのソフトウェアパッケージ、Heat map Illustrator (HemI 1.0) を開発した。ここで、1.0を大幅に改良し、7種類のクラスタリング手法と22種類の距離メトリックを実装したHemI 2.0をオンラインサービスとしてリリースする。HemI 2.0では、クラスタリング結果や出版品質のヒートマップを直接エクスポートすることができる。また、より詳細な解析のために、12種類のモデル生物と15種類の機能アノテーションを対象としたエンリッチメント解析のオプションを追加した。エンリッチメント結果は、バブルチャート、棒グラフ、コックスコームチャート、円グラフ、ワードクラウドの5つのイディオムで可視化することができる。HemI 2.0は、生体分子発現データの可視化だけでなく、追加のエンリッチメント解析にも有用なウェブサーバーとなることが期待されている。HemI 2.0は、全てのユーザーが自由に利用できるよう、https://hemi.biocuckoo.org/ で公開されている。
Documentation
https://hemi.biocuckoo.org/にアクセスする。
Microsoft Excel ワークブック (97-2003, *.xls; 07-2019, *.xlsx)、カンマ区切りのテキスト (*.csv)、タブ区切りのテキストファイル (*.txt) の3つの形式のファイルの読み込みをサポートしている。
Demo_data1.xlsx
ダウンロードしたDemo data1を読み込んだ。
クリックしてヒートマップに読み込む範囲を選択できる。また、行や列のタイトルをクリックすることで、対応するラベルを編集することができる。ここでは全体を視覚化する。下のselect allをクリックし、それからsubmitをクリックする。
また、submitクリック前にHeatmap Settingsをクリックすると、サイズや色指定、タイトル、出力時のフォーマットなどの設定を変更できる。
内部に数値を設定したり、対数変換のオプションもある。
Clustering Settingsでは、クラスタリング方法と距離法を設定できる。下側には説明が表示されている。上の行と列のクラスタリングを行う、にチェックを付ける。
submitをクリックした。画面が下にスクロールし、ヒートマップが表示された。右側には使用されたテーブルが表示されている。
矢印ボタンをクリックすると矢印方向にスクロールする。
デフォルトのクラスタリング適用後。
クラスタリングと底2の対数変換適用後。
他のデモデータも見てみる。Exampleボタンを押すと読み込まれる。すでにスタイルが適用されており、遺伝子セットエンリッチメント解析結果まで実行済みになっている。
demo1
demo2
demo3
demo4
demo5
その下の画面では遺伝子セットエンリッチメント解析を実行できる。遺伝子シンボルを入力し、生物、データベース、P値を指定する。
代表的なモデル生物に対応している。
利用可能なデータベース。Allだと全てのデータベース。データベースについてはDocumentで説明されている。
最後にEnrichment Analysisをクリックする。
出力例
サイト上では表と図は小さい。ダウンロードして開くと見やすい。
Bubble chart
Bar graph chart
Coxcomb chart
Pie chart
word cloud
ローカルアプリケーション
HemIは、macとwindowsのアプリケーションとしても利用できる。
HemIを起動してdemoを読み込んだ。ヒートマップを表示するアプリケーションとなっている。
引用
HemI 2.0: an online service for heatmap illustration
Wanshan Ning, Yuxiang Wei, Letian Gao, Cheng Han, Yujie Gou, Shanshan Fu, Dan Liu, Chi Zhang, Xinhe Huang, Sicheng Wu ... Show moreAuthor Notes
Nucleic Acids Research, Published: 07 June 2022
補足
このツールとは直接関係ありませんが、良いツイートをされている方がいらっしゃったので、そのツイートを貼っておきます。
"外れ値をチェックしない場合、2つのオブザベーションは、2つの特徴以外では類似しているように見えます。"
Here is "friends don't let friends make heatmap without checking outliers". This applies to using colors to represent numeric data in general. Having outliers in heatmap can really change how we perceive & interpret the visualization. pic.twitter.com/XycV1CAKEM
— Chenxin Li, PhD (@ChenxinLi2) June 7, 2022
"行と列の並び替えをしないと、ヒートマップから有用な情報を得ることはできない。"
New update: Friends Don't Let Friends Make Heatmap without (Considering) Reordering Rows & Columns
— Chenxin Li, PhD (@ChenxinLi2) June 6, 2022
In this example, it is impossible to get anything useful out of the heatmap w/o reordering rows & columns. pic.twitter.com/Rtw8TZGDSr
”データ可視化における良い慣行と悪い慣行についての意見をまとめた。”