ccontigsはコンティグ末端の配列がオーバーラップしているかどうか調べることで、コンティグからclosed circularなゲノムを探すツール。環状のプラスミドやウィルスを検出できるとされる。論文にはなっていない。
ただし直鎖状コンティグでも末端が重複していればcircularとして検出してしまう可能性があり、万能とは言えない(オーサーはそのような例は稀だとしている)。例えば同じ種類のリピート配列に挟まれた領域があれば、両末端とも同じリピートを少し進んだところで切れる。そのようなcontigはどうなるか?、など気になる点はあるが面白いツールだと思う。
インストール
依存
計算向け言語のjuliaで構築されてるので、ない人はjuliaをインストールしておく。
brew tap staticfloat/julia
brew install julia
本体
ラン
まずテストランを行う。
bash testcode.sh
circularなコンティグ(末端が重複)とlinearなコンティグのFASTAがダウンロードされる。
circularなコンティグを検出する。
julia ccontigs.jl -i ./test/testout.fa -o ./test/juliaout.tsv
引用
https://github.com/Microbiology/ccontigs?files=1
http://prophage.blogspot.jp/2016/09/how-to-detect-circular-virus-genomes.html