macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ヒートマップと遺伝子セットエンリッチメント解析のオンラインサービス HemI 2.0

 

 近年のハイスループットオミックス技術により、大量の生物学的データが生み出されている。このようなビッグオミックスデータを可視化することは、様々な生物学的問題に答えるために必要不可欠である。簡潔でありながら包括的な戦略として、ヒートマップは高次元で異質な生体分子発現データを解析し、魅力的なアートワークで可視化することができる。2014年、本著者らはヒートマップイラストレーションのために3つのクラスタリング手法と7つの距離メトリックを実装したスタンドアローンのソフトウェアパッケージ、Heat map Illustrator (HemI 1.0) を開発した。ここで、1.0を大幅に改良し、7種類のクラスタリング手法と22種類の距離メトリックを実装したHemI 2.0をオンラインサービスとしてリリースする。HemI 2.0では、クラスタリング結果や出版品質のヒートマップを直接エクスポートすることができる。また、より詳細な解析のために、12種類のモデル生物と15種類の機能アノテーションを対象としたエンリッチメント解析のオプションを追加した。エンリッチメント結果は、バブルチャート、棒グラフ、コックスコームチャート、円グラフ、ワードクラウドの5つのイディオムで可視化することができる。HemI 2.0は、生体分子発現データの可視化だけでなく、追加のエンリッチメント解析にも有用なウェブサーバーとなることが期待されている。HemI 2.0は、全てのユーザーが自由に利用できるよう、https://hemi.biocuckoo.org/ で公開されている。

 

Github

 

Documentation

HemI - Documentation

 

 

webサービス

https://hemi.biocuckoo.org/にアクセスする。

 

Microsoft Excel ワークブック (97-2003, *.xls; 07-2019, *.xlsx)、カンマ区切りのテキスト (*.csv)、タブ区切りのテキストファイル (*.txt) の3つの形式のファイルの読み込みをサポートしている。

Demo_data1.xlsx

 

ダウンロードしたDemo data1を読み込んだ。

クリックしてヒートマップに読み込む範囲を選択できる。また、行や列のタイトルをクリックすることで、対応するラベルを編集することができる。ここでは全体を視覚化する。下のselect allをクリックし、それからsubmitをクリックする。

 

また、submitクリック前にHeatmap Settingsをクリックすると、サイズや色指定、タイトル、出力時のフォーマットなどの設定を変更できる。

内部に数値を設定したり、対数変換のオプションもある。

Clustering Settingsでは、クラスタリング方法と距離法を設定できる。下側には説明が表示されている。上の行と列のクラスタリングを行う、にチェックを付ける。

 

submitをクリックした。画面が下にスクロールし、ヒートマップが表示された。右側には使用されたテーブルが表示されている。

矢印ボタンをクリックすると矢印方向にスクロールする。

 

デフォルトのクラスタリング適用後。

 

クラスタリングと底2の対数変換適用後。

 

他のデモデータも見てみる。Exampleボタンを押すと読み込まれる。すでにスタイルが適用されており、遺伝子セットエンリッチメント解析結果まで実行済みになっている。

demo1

demo2

demo3

demo4

demo5

 

 

 

その下の画面では遺伝子セットエンリッチメント解析を実行できる。遺伝子シンボルを入力し、生物、データベース、P値を指定する。

 

代表的なモデル生物に対応している。

利用可能なデータベース。Allだと全てのデータベース。データベースについてはDocumentで説明されている。

最後にEnrichment Analysisをクリックする。

 

出力例

サイト上では表と図は小さい。ダウンロードして開くと見やすい。

 

Bubble chart

Bar graph chart

Coxcomb chart

Pie chart

word cloud

 

ローカルアプリケーション

HemIは、macwindowsのアプリケーションとしても利用できる。

HemIを起動してdemoを読み込んだ。ヒートマップを表示するアプリケーションとなっている。

 

引用

HemI 2.0: an online service for heatmap illustration 
Wanshan Ning, Yuxiang Wei, Letian Gao, Cheng Han, Yujie Gou, Shanshan Fu, Dan Liu, Chi Zhang, Xinhe Huang, Sicheng Wu ... Show moreAuthor Notes
Nucleic Acids Research, Published: 07 June 2022

 

補足

このツールとは直接関係ありませんが、良いツイートをされている方がいらっしゃったので、そのツイートを貼っておきます。

"外れ値をチェックしない場合、2つのオブザベーションは、2つの特徴以外では類似しているように見えます。"

"行と列の並び替えをしないと、ヒートマップから有用な情報を得ることはできない。"

”データ可視化における良い慣行と悪い慣行についての意見をまとめた。”