macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

multi-omicsデータセットを可視化するCircosのラッパーツール MS-Helios

 

 マイクロアレイ、次世代シークエンシング、および質量分析(MS)などの革新的なハイスループット技術は、生物学的システムに対する我々の理解を大いに進歩させた。これらのすぐに利用可能で費用対効果に優れた包括的なデータ取得方法により、システム生物学はシングルオミクスからマルチオミクスデータ分析へと移行しつつある[論文より ref.1]。しかし、何千ものマルチオミクス分子プロファイルを統合して視覚化することは、システム生物学に新たな挑戦をもたらす。今日まで、ほとんどの多項式分析方法は、クラスタリング、相関[ref.2]、または次元削減方法、例えば視覚化前にデータを変換する主成分分析[ref.3]に依存している。

 Holisticで統合されたビューを提供するために、著者らは最近、プロテオーム中心の方法で円形のプロットでサンプルの特徴を視覚化する、 circular proteome maps (CPMs)を導入した[ref.4 link]。circular plotでは、ヒストグラム、散布図、折れ線プロットなどのよく知られているプロットタイプに依存して、直感的で審美的な方法で高次元データと特徴の関係を視覚化できる[ref.5、6]。さらに、データトラックは、複数のオミクスレベルにわたって特定の機能をコンテキスト化するための手段を提供する。circular plotを作成するための最も標準的なソフトウェアはCircosである。これはコマンドラインベースのPerlプログラムで、学習曲線がsteepである[ref.5]。円形のプロットの構築プロセスと視覚化を容易にするために、複数のRパッケージとツールが利用可能です[ref.6、7、8、9、10]。これらのツールは、ゲノムデータ用に構築されているか、他のデータソースをゲノムベースにマッピングしている。それらのいずれも、非ゲノムベースでのマルチオミクスデータ統合または視覚化を考慮していない。

 非ゲノムベースでcircular plotの作成を容易にするために、MS-Heliosと呼ばれるCircosラッパーを開発した。 MS-Heliosは、迅速なプロトタイピング、データ探索、そして簡単に高品質でpublish-ready な図を作成することを可能にするコマンドラインツールである。

 

 

 

インストール 

ubuntu16.04のminiconda3-4.0.5で動作確認した。

依存

#Anacondaを使っているならcodaで導入可能
conda install -c bioconda -y circos

本体 SourceForge

マニュアルPDFも本体に付属

f:id:kazumaxneo:20190119122844p:plain

> java -jar MS-Helios.jar -h 

$ java -jar MS-Helios.jar -h

usage: java -jar MS-Helios.jar -i <file> [OPTION] [<ARGUMENT>]

MS-Helios: A Circos wrapper to visualize multi-omic datasets

 -a,--add <plot>                define data track plot type; plot is

                                histogram, scatter, line, or highlight

 -c,--colors <scheme>           group colors, e.g., blues, brbg, accent,

                                see Circos brewer colors for more

                                [default: B/W]

 -d,--delimiter <character>     field delimiter character [default: ,]

 -e,--grid                      adds grid line to separate groups over

                                data tracks

 -f,--filter <method> <value>   apply filter; method is percentile v or

                                top-hat v

 -g,--group                     group features by sample occurrence

 -h,--help                      print this message

 -i,--input <file>              use given input file

 -l,--load <path>               load helios file [default:

                                MS-Helios.helios]

 -m,--missing <value>           missing value [default: 0]

 -n,--normalize <method>        use normalization; method is scale,

                                z_score, divide_min, divide_max,

                                divide_mean, divide_sd, or divide_sum

 -o,--output <path>             use given output path [default: jar path]

 -p,--partition                 plot samples separate

 -s,--sort <order>              sort data tracks; order is asc or dsc

 -t,--transform <method>        use transformation; method is shannon,

                                log2, or log10

 -v,--version                   print the version information

Please report bugs to: https://sourceforge.net/p/ms-helios/tickets

 

入力データフォーマット(マニュアルより)

f:id:kazumaxneo:20190119132024p:plain

 

テストラン

1、circosのランに必要なconfigファイル作成

cd MS-Helios-1/
java -jar MS-Helios.jar -i data/LFQ_protein.csv -g
  • -i       use given input file
  • -g      group features by sample occurrence

 

2、circosで可視化

circos –conf MS-Helios.config

 

引用

MS-Helios: a Circos wrapper to visualize multi-omic datasets

Harald Marx, Joshua J. Coon

BMC Bioinformatics201920:21

 

関連