構造変化検出結果はツールによって得手不得手があるため、網羅的にSVを検出するためには、現状複数ツールを並行して走らせるのが理想とされる。そのため、複数のツール結果を統合して弱点を無くすような方法論も出て来たりしている。しかし、ツールによって出力のVCFファイルがVCF4.2に完全には準拠していないものも多く、結果を統合するのは実は簡単ではない。
mergeSVcallersは、Zev KronenbergさんがGithubで公開しているSV検出結果を統合するツールである。現在はLumpyの解析結果、GENOME STRIP CNVsの解析結果、wham (whamg) の解析結果を統合することができる。
インストール
git clone --recursive https://github.com/zeeev/mergeSVcallers.git
cd mergeSVcallers/
make
実行方法
mergeSVcallers -a ref.fasta -f a.vcf.gz,b.vcf.gz -t WHAM,LUMPY -s 500
- -a The samtools faidx indexed FASTA file
- -f A comma separated list of Tabix indexed VCF files
- -t A comma separated list of tags/identifiers for each file
- -s Merge SVs with both breakpoints N BP away [100]
- -r Reciprocal overlap also required [0]
結果からベン図をかくスクリプトも準備されている。
準備中