macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

インタラクティブなdot plotビューア dot

 

 

ゲノムとゲノムのアライメントを視覚化する方法の1つに、両方のゲノムのアライメントの概要を提供するドットプロットがある。一般的なゲノムブラウザ(IGVやUCSCゲノムブラウザなど)が1つの次元でゲノムデータをプロットするのとは異なり、ドットプロットでは、一方の軸にリファレンスゲノムが配置され、もう一方の軸にクエリのゲノムが配置される。 2つのゲノム間のアライメントは、両方のゲノムの座標に従って配置される。

DNAnexusインタラクティブなドットプロットビューアDotは、ラージゲノムをすばやくプロットできる。ユーザーは関心ある領域にズームインして、2ゲノム間のアラインメントを調べることができる。

 

Dot: An Interactive Dot Plot Viewer for Comparative Genomics

https://blog.dnanexus.com/2018-01-11-dot-an-interactive-dot-plot-viewer-for-comparative-genomics/

 

Github

ヘルパースクリプト

> python DotPrep.py -h

$ python DotPrep.py -h

usage: DotPrep.py [-h] --delta DELTA [--out OUT]

                  [--unique-length UNIQUE_LENGTH] [--overview OVERVIEW]

 

Take a delta file, apply Assemblytics unique anchor filtering, and prepare

coordinates input files for Dot

 

optional arguments:

  -h, --help            show this help message and exit

  --delta DELTA         delta file

  --out OUT             output file

  --unique-length UNIQUE_LENGTH

                        The total length of unique sequence an alignment must

                        have on the query side to be retained. Default: 10000

  --overview OVERVIEW   The number of alignments to include in the coords.idx

                        output file, which will be shown in the overview for

                        Dot. Default: 1000

 

 

on line

1, nucmer (オプションなしで実行する)

nucmer --prefix=nucmer_output ref_genome.fa query_genome.fa

 

2, helper scriptのラン(必要に応じてパラメータ設定する)

python DotPrep.py --delta nucmer_output.delta --out OUTPUT

出力

f:id:kazumaxneo:20200127105716p:plain

 

https://dnanexus.github.io/dot/にアクセスする。.coordsとindexファイルを読み込む。

f:id:kazumaxneo:20200127105849p:plain

視覚化された。直感的に操作できるので説明は省略する。

f:id:kazumaxneo:20200127105943p:plain

 

引用

GitHub - MariaNattestad/dot: Dot: An interactive dot plot viewer for comparative genomics

 

関連