Circular consensus sequencing (CCS) リードは、構造変異(SV)を包括的に検出することができると期待されている。しかし、アラインメントベースのSVコールパイプラインは、完全なリードアラインメントの生成とその後処理のために計算量が多くなる。ここでは、SKeletonをベースにした構造変異検出のための解析ツールキット(SKSV)を提案する。実データおよびシミュレーションデータを用いたベンチマークにより、SKSVは最先端のSVコールアプローチよりも1桁以上高速であり、さらに、様々なタイプのSVに対して高いF1スコアを達成することが実証された。SKSVは、https://github.com/ydLiu-HIT/SKSV から入手できる。
インストール
依存
- python3
- Biopython
- numpy
- samtools
git clone https://github.com/ydLiu-HIT/SKSV.git
cd SKSV/skeleton/
make ## built ./SKSV-skeleton
cd ..
> ./SKSV
$./SKSV Program: SKSV-ultrafast structural variant detection from CCS readsVersion: 1.0.2Contact: <ydliu@hit.edu.cn>
Usage: SKSV <commad> [options]Command: index index the reference sequence using de bruijn graph aln generate alignment skeletons for SV signatures and output to svseg format file call perform structural variants calling
実行方法
1、Reference genome indexing
SKSV index ref.fa HashIndexDir
HashIndexDir/ができる。
2、Skeleton alignment
CCS readのfasta (fastq)を指定する。
SKSV aln HashIndexDir read.fa -o skeleton.svseg
SV signaturesファイルskeleton.svsegが出力される。
3、Variant calling
SKSV call skeleton.svseg ref.fa output.vcf workdir
引用
SKSV: ultrafast structural variation detection from circular consensus sequencing reads
Yadong Liu, Tao Jiang, Junhao Su, Bo Liu, Tianyi Zang, Yadong Wang
Bioinformatics, Published: 08 May 2021