マイクロアレイ、次世代シークエンシング、および質量分析(MS)などの革新的なハイスループット技術は、生物学的システムに対する我々の理解を大いに進歩させた。これらのすぐに利用可能で費用対効果に優れた包括的なデータ取得方法により、システム生物学はシングルオミクスからマルチオミクスデータ分析へと移行しつつある[論文より ref.1]。しかし、何千ものマルチオミクス分子プロファイルを統合して視覚化することは、システム生物学に新たな挑戦をもたらす。今日まで、ほとんどの多項式分析方法は、クラスタリング、相関[ref.2]、または次元削減方法、例えば視覚化前にデータを変換する主成分分析[ref.3]に依存している。
Holisticで統合されたビューを提供するために、著者らは最近、プロテオーム中心の方法で円形のプロットでサンプルの特徴を視覚化する、 circular proteome maps (CPMs)を導入した[ref.4 link]。circular plotでは、ヒストグラム、散布図、折れ線プロットなどのよく知られているプロットタイプに依存して、直感的で審美的な方法で高次元データと特徴の関係を視覚化できる[ref.5、6]。さらに、データトラックは、複数のオミクスレベルにわたって特定の機能をコンテキスト化するための手段を提供する。circular plotを作成するための最も標準的なソフトウェアはCircosである。これはコマンドラインベースのPerlプログラムで、学習曲線がsteepである[ref.5]。円形のプロットの構築プロセスと視覚化を容易にするために、複数のRパッケージとツールが利用可能です[ref.6、7、8、9、10]。これらのツールは、ゲノムデータ用に構築されているか、他のデータソースをゲノムベースにマッピングしている。それらのいずれも、非ゲノムベースでのマルチオミクスデータ統合または視覚化を考慮していない。
非ゲノムベースでcircular plotの作成を容易にするために、MS-Heliosと呼ばれるCircosラッパーを開発した。 MS-Heliosは、迅速なプロトタイピング、データ探索、そして簡単に高品質でpublish-ready な図を作成することを可能にするコマンドラインツールである。
インストール
ubuntu16.04のminiconda3-4.0.5で動作確認した。
依存
#Anacondaを使っているならcodaで導入可能
conda install -c bioconda -y circos
本体 SourceForge
マニュアルPDFも本体に付属
usage: java -jar MS-Helios.jar -i <file> [OPTION] [<ARGUMENT>]
MS-Helios: A Circos wrapper to visualize multi-omic datasets
-a,--add <plot> define data track plot type; plot is
histogram, scatter, line, or highlight
-c,--colors <scheme> group colors, e.g., blues, brbg, accent,
see Circos brewer colors for more
[default: B/W]
-d,--delimiter <character> field delimiter character [default: ,]
-e,--grid adds grid line to separate groups over
data tracks
-f,--filter <method> <value> apply filter; method is percentile v or
top-hat v
-g,--group group features by sample occurrence
-h,--help print this message
-i,--input <file> use given input file
-l,--load <path> load helios file [default:
-m,--missing <value> missing value [default: 0]
-n,--normalize <method> use normalization; method is scale,
z_score, divide_min, divide_max,
divide_mean, divide_sd, or divide_sum
-o,--output <path> use given output path [default: jar path]
-p,--partition plot samples separate
-s,--sort <order> sort data tracks; order is asc or dsc
-t,--transform <method> use transformation; method is shannon,
log2, or log10
-v,--version print the version information
Please report bugs to: https://sourceforge.net/p/ms-helios/tickets
入力データフォーマット(マニュアルより)
テストラン
1、circosのランに必要なconfigファイル作成
cd MS-Helios-1/
java -jar MS-Helios.jar -i data/LFQ_protein.csv -g
- -i use given input file
- -g group features by sample occurrence
2、circosで可視化
circos –conf MS-Helios.config
引用
MS-Helios: a Circos wrapper to visualize multi-omic datasets
Harald Marx, Joshua J. Coon
BMC Bioinformatics201920:21
関連