macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

SVを検出する wham

 

whamはsplit-read情報、soft-clipping情報、コンセンサス配列情報などを統合してSVを検出するSV検出の方法論。サイズの大きなSVも検出することが可能である。ダウンロードできるパッケージにはwhamとwhamgの2つのツールが入っている。2015年に発表された論文ではオリジナルのwhamが使用されているが、whamは高感度でfalse positiveも多いため、オーサーらは、false positiveを減らすように改良されたwhamgを使うことを推奨している。

 

公式サイト

Wham

インストール

Github

git clone --recursive https://github.com/zeeev/wham.git; cd wham; make 

macでは動作中にエラ-を起こしたのでcent OSに導入した。 

condaでも導入できる(linux only リンク)。

#Anaconda環境にて
conda install -c bioconda wham

  

実行方法

whamgを使うフローのみ紹介する。

inputのbamはbwa memを用いてアライメント後、ソートされduplicate tagもつけたものを使うことが推奨されている。

whamg -a Homo_sapiens_assembly19.fasta -f CHM1_1.bam | perl utils/filtWhamG.pl > chm1.vcf 2> chm1.err

 

制作途中

 

 

 

引用

Wham: Identifying Structural Variants of Biological Consequence

Zev N. Kronenberg, Edward J. Osborne, Kelsey R. Cone, Brett J. Kennedy, Eric T. Domyan, Michael D. Shapiro, Nels C. Elde, Mark Yandell

PLoS Comput Biol. 2015 Dec 1;11(12):e1004572.