macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

cgMLSTコールから距離行列を出力する cgmlst-dists

 

 

タイトルの通りのツール。 ChewBBACA(Github)の出力に対応している。

 

インストール

Github

#bioconda (link)
conda install -c bioconda cgmlst-dists

#from source
git clone https://github.com/tseemann/cgmlst-dists.git
cd cgmlst-dists
make

cgmlst-dists

$ cgmlst-dists

SYNOPSIS

  Pairwise CG-MLST distance matrix from allele call tables

USAGE

  cgmlst-dists [options] chewbbaca.tab > distances.tsv

OPTIONS

  -h Show this help

  -v Print version and exit

  -q Quiet mode; do not print progress information

  -c Use comma instead of tab in output

  -m N Output: 1=lower-tri 2=upper-tri 3=full [3]

  -x N Stop calculating beyond this distance [9999]

URL

  https://github.com/tseemann/cgmlst-dists

 

実行方法

ChewBBACAからのcgMLST allele callのファイルを指定する。

git clone https://github.com/tseemann/cgmlst-dists.git
cd cgmlst-dists/
cgmlst-dists test/boring.tab > distances.tab

出力

f:id:kazumaxneo:20201125235715p:plain

正の整数ではないアレルコールはすべてゼロに変換される。距離はハミング距離(wiki)だが、ゼロを除いたものになる。

 

引用

GitHub - tseemann/cgmlst-dists: 🐻⇔🐨 Calculate distance matrix from ChewBBACA cgMLST allele call tables