macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2倍体アセンブリのシンプルなSVコーラー dipdiff

 

dipdiffは2倍体アセンブリのためのシンプルなSVコールパッケージである。svim-asmの修正版を使用している。このパッケージは、アライナーのバージョンとパラメータに依存する可能性があるため、実行間の再現性を確保するために、独自のバージョンのminimap2を含んでいる。

 

 

インストール

オーサーが提供しているdockerイメージを使ってテストした。

Github

#docker (dockerhub link)
docker pull mkolmogo/dipdiff:0.1

#from source (samtoolsも必要)
git clone https://github.com/fenderglass/dipdiff
cd dipdiff
git submodule update --init
make
pip install -r requirements.txt

 

 

実行方法

リファレンス配列のFASTA形式ファイル、一対のハプロタイプFASTA形式ファイルを指定する。

DD_DIR=`pwd`
docker run -v $DD_DIR:$DD_DIR --ipc=host -u `id -u`:`id -g` mkolmogo/dipdiff:0.1 dipdiff.py --reference $DD_DIR/ref.fasta --pat $DD_DIR/hap_1.fasta --mat $DD_DIR/hap_2.fasta --out-dir $DD_DIR/dipdiff -t 20

 

出力例(動作確認のため、小さなゲノムを使用)

f:id:kazumaxneo:20211110213059p:plain

VCF 形式構造バリアントコール、SVの種類を示したサマリーレポートが出力される。

 

引用

https://github.com/fenderglass/dipdiff

 

関連