whamはsplit-read情報、soft-clipping情報、コンセンサス配列情報などを統合してSVを検出するSV検出の方法論。サイズの大きなSVも検出することが可能である。ダウンロードできるパッケージにはwhamとwhamgの2つのツールが入っている。2015年に発表された論文ではオリジナルのwhamが使用されているが、whamは高感度でfalse positiveも多いため、オーサーらは、false positiveを減らすように改良されたwhamgを使うことを推奨している。
公式サイト
インストール
git clone --recursive https://github.com/zeeev/wham.git; cd wham; make
macでは動作中にエラ-を起こしたのでcent OSに導入した。
#Anaconda環境にて
conda install -c bioconda wham
実行方法
whamgを使うフローのみ紹介する。
inputのbamはbwa memを用いてアライメント後、ソートされduplicate tagもつけたものを使うことが推奨されている。
whamg -a Homo_sapiens_assembly19.fasta -f CHM1_1.bam | perl utils/filtWhamG.pl > chm1.vcf 2> chm1.err
制作途中
引用
Wham: Identifying Structural Variants of Biological Consequence
Zev N. Kronenberg, Edward J. Osborne, Kelsey R. Cone, Brett J. Kennedy, Eric T. Domyan, Michael D. Shapiro, Nels C. Elde, Mark Yandell
PLoS Comput Biol. 2015 Dec 1;11(12):e1004572.