構造変化(SV)を有するサンプルの全ゲノムシーケンシング(WGS)データでは、そのような異常をシンプルなプロットで視覚化する必要性を生じさせる。 WGSデータの従来の2次元表現は、円形または線形レイアウトを頻繁に使用する。これらの表現にはいくつかの利点があるが、主な欠点は2次元空間を効率的に使用しないことである。我々はGenome U-Plotと呼ばれるレイアウトを提案する。このレイアウトは、2次元表面に染色体を広げ、本質的に空間解像度を4倍にする。これにより、欠失、増幅、および染色体修復・再生などのSVを視覚化することによって、新しい洞察および仮説を生成することができる。Genome U-Plotの主な特徴は、階層化されたレイアウト、その高い空間分解能、および改善された美的品質である。我々は、従来の視覚化スキーマとGenome U-Plotとを、線交差数および交差角度分解能などの視覚化メトリクスを用いて比較する。我々の測定基準に基づいて、得られたグラフの可読性を少なくとも2倍向上させ、重要な特徴を明らかにし、重要なゲノムの変化を容易に同定できるようにする。
GenomeUPlotに関するツイート
インストール
依存
- yarn(Node.js package manager which is much faster than NPM)
npm install --global yarn
本体 Github
git clone https://github.com/gaitat/GenomeUPlot.git
cd GenomeUPlot/
yarn install
テストラン
yarn start
#別のタブから
open http://localhost:8000/GenomePlot.html?sampleId=LNCAP -a safari
#または
open http://localhost:8000/GenomePlot.html?sampleId=NA12878 -a safari
Circos
hg19とhg38のcytobandファイルはublic/reference/cytobandsに準備されています。それ以外に必要なデータ構造についてはGithubを読んでください。circos plotで使うフォーマットに準じているようです。
引用
Genome U-Plot: a whole genome visualization
Athanasios Gaitatzes Sarah H Johnson James B Smadbeck George Vasmatzis
Bioinformatics, Volume 34, Issue 10, 15 May 2018, Pages 1629–1634