macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

環状ゲノムを探す ccontigs

 

ccontigsはコンティグ末端の配列がオーバーラップしているかどうか調べることで、コンティグからclosed circularなゲノムを探すツール。環状のプラスミドやウィルスを検出できるとされる。論文にはなっていない。

ただし直鎖状コンティグでも末端が重複していればcircularとして検出してしまう可能性があり、万能とは言えない(オーサーはそのような例は稀だとしている)。例えば同じ種類のリピート配列に挟まれた領域があれば、両末端とも同じリピートを少し進んだところで切れる。そのようなcontigはどうなるか?、など気になる点はあるが面白いツールだと思う。

 

 

インストール

依存

計算向け言語のjuliaで構築されてるので、ない人はjuliaをインストールしておく。

brewで導入できる(参考リンク)。

brew tap staticfloat/julia
brew install julia

本体

GIthub

 

ラン

まずテストランを行う。

bash testcode.sh

circularなコンティグ(末端が重複)とlinearなコンティグのFASTAがダウンロードされる。

 

circularなコンティグを検出する。

julia ccontigs.jl -i ./test/testout.fa -o ./test/juliaout.tsv

 

 

引用

https://github.com/Microbiology/ccontigs?files=1

 

http://prophage.blogspot.jp/2016/09/how-to-detect-circular-virus-genomes.html