macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Bandageを使いアセンブルのgraphを可視化する

 

bandageはde novo assemblerのfastgファイルを入力として、graphパスを描画してくれるソフトウエア。アセンブルを支援するツールとして2015年に論文が発表された。

 

 

追記: カバレッジでグラフを書くコマンドを追加。

 

 インストール

公式サイト

f:id:kazumaxneo:20170911215239j:plain

公式サイトからdmgファイルをダウンロード。指示にしたがってインストールする。

bandage wiki

https://github.com/rrwick/Bandage/wiki

 

spadesのグラフデータを使う場合、spadesのスクリプトspades_contig_graph.pyを使いフォーマットを少し変える必要がある。brewでspadesをインストールしているなら以下のように打つ。

spades_contig_graph.py -p length -l assembly_graph.fastg contigs.fasta contigs.paths output_L.fastg #length
spades_contig_graph.py -p coverage -c assembly_graph.fastg contigs.fasta contigs.paths output_C.fastg #length #coverage

contigs.fasta、contigs.path、assembly_graph.fastgは、spadesのアセンブル結果出力ディレクトリにできているはずである。出力されるカバレッジまたはlengthのfastgをbandageに入力する。

 

ラン

inputよりfastgファイルを選択。

 f:id:kazumaxneo:20170911233837j:plain

Draw Graphをクリックするとアセンブルのgraphが描画される。 

f:id:kazumaxneo:20170911234007j:plain 

-基本操作-

  • 拡大縮小:Trackpadでピンチイン/アウトかマウスホイールを回す。
  • 画面のスクロール:Trackpadで2本指のドラッグかCtrl+画面のドラッグ。
  • ノードの移動:ドラッグでノードを引っ張る。
  • 複数ノードの移動:ノードをマウスで囲い選択してから引っ張る。
  • edgeの形の変更:controlキーを押しながらedgeの変更したい部分をドラッグ。
  • 画面の回転:Trackpadで2本指の回転か、Ctrl+画面の右クリックドラッグ。

 

指定した情報をnodeの上に表示できる。

f:id:kazumaxneo:20170911234452j:plain

 マーカー遺伝子がアセンブルされたcontigのどこに存在するか確認したいことがある。そういう時はbandage内部でBLAST解析すれば良い。Create/view BLAST searchを選択。

f:id:kazumaxneo:20170911234846j:plain

 Build BLAST databaseをクリックし、contig配列からBLASTデータベースを作成する。

f:id:kazumaxneo:20170911234639j:plain

  左上の方のLoad from FASTA fileを選択し、探したい配列のfastaファイルを選択する。終わったら中央下のRun BLAST searchを選択する。

 

解析が終わるとヒットしたノード名と領域が表示され、されにノードのヒットした領域がカラー表示される。

f:id:kazumaxneo:20170911235520j:plain

アノテーションをかけてコード領域のfnaファイルがあれば、遺伝子を可視化することも可能。prokkaなどが高速で使いやすい(リンク)。

 

 

contigを探すなら、右上の小窓にcontig名を打つ。

f:id:kazumaxneo:20170911235756j:plain

 

Bandageを使えば、アセンブルが途切れている可能性がある耐性カセットの位置を見極めるのも簡単である。例えば以下の記事では、bandageを使ったアセンブルのグラフからカセット配列を見つける流れが書かれている。

https://holtlab.net/2015/07/20/locating-drug-resistance-regions-in-short-reads-using-bandage-and-ismapper/

 

 

引用

Bandage: interactive visualization of de novo genome assemblies.

Wick RR1, Schultz MB1, Zobel J2, Holt KE1.

Bioinformatics. 2015 Oct 15;31(20):3350-2. doi: 10.1093/bioinformatics/btv383. Epub 2015 Jun 22.