シーケンシング技術の莫大な発展はゲノムデータの蓄積を加速させ、指数関数的蓄積を引き起こし、ヒトゲノム研究を著しく加速させた。一方、生物学的研究では、増加するサンプルからのトランスオミクスデータを分析している。多くの適切に設計された視覚化は、結果の結果を明確かつ完全に報告するためにpublicationで広く利用されている。最近のガンゲノム研究では、一般に数百の腫瘍ゲノムデータを分析し、mutation burden、突然変異遺伝子、生物学的パスウェイなどの一連の属性間でそれらを比較すが、これらはよく知られている‘Landscape’ figuresで一般的に示される。ランドスケープ図とその変形は、すべてのサンプルの関心のある多層特性パターンを一度に要約するのに最適であるため、サンプルの大規模コホートの研究で広く適用されている。これらの数値の実装は、十分なプログラミングスキルを必要とし、publicationのために微調整する多大な努力を必要とするため、生物学研究者にとって課題のままである。さらに、既存のソフトウェアパッケージによって生成される数値は静的であるため、インタラクティブなデータ探索が不可能になる。
ここでは、LandScapeovizを紹介する。これは、バッチサンプルの統合マルチレイヤーデータをインタラクティブかつリアルタイムに視覚化するためのWebベースのアプリケーションである。 LandScapeは、適切に設計されたフォーマットを使用して複数のデータタイプを処理し、表示をカスタマイズし、結果を調べ、高品質の図を生成する一連の組み込み関数を提供する。
「LandScape」ビジュアライゼーションは、バッチサンプルの複数のレイヤーからの統合データの体系的な図を提供するために頻繁に利用される。これらのデータは、ガンで変異した遺伝子や生物学的パスウェイなどの特定の属性で互いに比較される。 このオンラインの「LandScape」ビジュアライゼーションは、追加のパネル(年齢、性別、組織学など)を備えた固定部分(ヒストグラムと遺伝子パネル)で設計されている。
Oviz-Bio Github
使い方
Oviz-Bio
Oviz-Bioは、ランドスケープビュー、SNVシグネチャ、突然変異対遺伝子、CNV、融合遺伝子、SV、および染色体3Dコンフォメーションなどの分析をサポートしている。
https://bio.oviz.org/demo-project にアクセスする。
データを視覚化するには、必要な形式でCSVファイルをアップロードし、サイドバーオプションを使用して表示をカスタマイズする。
demoのCSVをアップロードした。
ダークモードOFF
入力ファイルCSVは1行目がヘッダー、2行目以降に1サンプル1行ずつ記載していく。de movo CSVをexcelで開いた。
拡大した。1列目はsampleID。2列目以降に表示したい遺伝子を記載する。変異なしは"-"で表記する。not availableはN/Aで表記する。
この変異情報の遺伝子パネル情報だけアップロードした場合、変異の垂直トラック図と変異の種類のヒストグラムだけが出力される。
横方向がサンプル、ここではT119まである。縦方向が遺伝子。
サブタイプ、性別、などの属性情報もアップすると、上に示したように追加のヒストグラムが表示される。詳細はmanualと、マニュアルの上からダウンロードできるテストデータを確認してください。
引用
LandScape: a web application for interactive genomic summary visualization
Wenlong Jia, Hechen Li, Shiying Li, Shuaicheng Li
bioRxiv preprint first posted online Dec. 6, 2019
関連