macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

アセンブルのgraphを可視化する GUIツール Bandage

 2018 9/19 コマンド修正

 

bandageはde novo assemblerのfastgファイルを入力として、graphパスを描画してくれるソフトウエア。アセンブルを支援するツールとして2015年に論文が発表された。

 

 インストール

公式サイト

f:id:kazumaxneo:20170911215239j:plain

公式サイトからdmgファイルをダウンロード。指示にしたがってインストールする。

bandage wiki

https://github.com/rrwick/Bandage/wiki

./spades_contig_graph.py  -h

$ ./spades_contig_graph.py  -h

usage: spades_contig_graph.py [-h] [-p PATHS_OUT] (-c | -l)

                              graph contigs paths output

 

SPAdes Contig Graph: a tool for creating FASTG contig graphs from SPAdes

assemblies

 

positional arguments:

  graph                 The assembly_graph.fastg file made by SPAdes

  contigs               A contigs or scaffolds fasta file made by SPAdes

  paths                 The paths file which corresponds to the contigs or

                        scaffolds file

  output                The graph file made by this program

 

optional arguments:

  -h, --help            show this help message and exit

  -p PATHS_OUT, --paths_out PATHS_OUT

                        Save the paths to this file (default: do not save

                        paths)

  -c, --connection_priority

                        Prioritise graph connections over segment length

  -l, --length_priority

                        Prioritise segment length over graph connections

——

 

 

spadesのグラフデータを使う場合、spadesのスクリプトspades_contig_graph.pyを使いフォーマットを少し変える必要がある。brewでspadesをインストールしているなら以下のように打つ。

#length
./spades_contig_graph.py -l assembly_graph.fastg contigs.fasta contigs.paths output_length.fastq

#coverage
./spades_contig_graph.py -c assembly_graph.fastg contigs.fasta contigs.paths output_coverage.fastq

contigs.fasta、contigs.path、assembly_graph.fastgは、spadesのアセンブル結果出力ディレクトリに存在する。それを指定している。"-p prefix" でpathファイルも別途保存できる。

またはscaffoldsに対して実行する。出力されるfastgをbandageに入力する。

 

実行方法

inputよりfastgファイルを選択。

 f:id:kazumaxneo:20170911233837j:plain

Draw Graphをクリックするとアセンブルのgraphが描画される。 

f:id:kazumaxneo:20170911234007j:plain 

-基本操作-

  • 拡大縮小:Trackpadでピンチイン/アウトかマウスホイールを回す。
  • 画面のスクロール:Trackpadで2本指のドラッグかCtrl+画面のドラッグ。
  • ノードの移動:ドラッグでノードを引っ張る。
  • 複数ノードの移動:ノードをマウスで囲い選択してから引っ張る。
  • edgeの形の変更:controlキーを押しながらedgeの変更したい部分をドラッグ。
  • 画面の回転:Trackpadで2本指の回転か、Ctrl+画面の右クリックドラッグ。

 

指定した情報をnodeの上に表示できる。

f:id:kazumaxneo:20170911234452j:plain

 マーカー遺伝子がアセンブルされたcontigのどこに存在するか確認したいことがある。そういう時はbandage内部でBLAST解析すれば良い。Create/view BLAST searchを選択。

f:id:kazumaxneo:20170911234846j:plain

 Build BLAST databaseをクリックし、contig配列からBLASTデータベースを作成する。

f:id:kazumaxneo:20170911234639j:plain

  左上の方のLoad from FASTA fileを選択し、探したい配列のfastaファイルを選択する。終わったら中央下のRun BLAST searchを選択する。

 

解析が終わるとヒットしたノード名と領域が表示され、されにノードのヒットした領域がカラー表示される。

f:id:kazumaxneo:20170911235520j:plain

アノテーションをかけてコード領域のfnaファイルがあれば、遺伝子を可視化することも可能。prokkaなどが高速で使いやすい(リンク)。

 

 

contigを探すなら、右上の小窓にcontig名を打つ。

f:id:kazumaxneo:20170911235756j:plain

 

Bandageを使えば、アセンブルが途切れている可能性がある耐性カセットの位置を見極めるのも簡単である。例えば以下の記事では、bandageを使ったアセンブルのグラフからカセット配列を見つける流れが書かれている。

https://holtlab.net/2015/07/20/locating-drug-resistance-regions-in-short-reads-using-bandage-and-ismapper/

 

 

引用

Bandage: interactive visualization of de novo genome assemblies

Wick RR, Schultz MB, Zobel J, Holt KE

Bioinformatics. 2015 Oct 15;31(20):3350-2