macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

近縁な何百~何千のバクテリアの系統解析を行うGubbins

 

GubbinsはpyhtonとCで実装されたごくごく近縁なバクテリアの系統解析やSNV検出を行う方法論。

 

 インストール 

Github

https://github.com/sanger-pathogens/gubbins

brewで導入できる。

brew install gubbins

  

ラン

ランにはマルチプルアライメント実行済みのファイルを使う。マニュアルではゲノムのマルチプルアライメントのツール例としてSnippyが挙げられている(Snippyの使い方)。

 

ここでは論文中のマルチプルアライメント実行済みalnファイルがダウンロードできるので、これを使う。 Gitの公式ページからダウンロード(下の方ののftp://ftp.〜から)。

ダウンロードしたalnファイルを指定して実行。

run_gubbins.py ST239.aln 

数分で解析は終わる。

いくつかのファイルが出力される。詳細はGithubトップページ参照。

f:id:kazumaxneo:20171210211327j:plain

 

出力される系統樹ファイルST239.final_tree.tre(newick format )をFigtreeで開く。

f:id:kazumaxneo:20171210210513j:plain

 フォントやノードのサイズはFigtree -> Preferencesから調整。

 

 

 

引用

Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins

Nicholas J. Croucher Andrew J. Page Thomas R. Connor Aidan J. Delaney Jacqueline A. Keane Stephen D. Bentley Julian Parkhill Simon R. Harris

Nucleic Acids Research, Volume 43, Issue 3, 18 February 2015, Pages e15, https://doi.org/10.1093/nar/gku119

 

Figtree

http://tree.bio.ed.ac.uk/software/figtree/