SlnCは最も多い変異であるSNV、indel、CNVをシミュレートできるNGSのリードシミュレーションツール。マルチコアに対応しており、ARTのようなツールと比較して高速にカバレッジのディープなデータセットを発生させることができる。
ダウンロード
依存
brewで導入できる。
SourceForge (Binaryのみ)
https://sourceforge.net/p/sincsimulator/code/ci/master/tree/
git clone https://git.code.sf.net/p/sincsimulator/code sincsimulator-code
注: mac OSXのようなDarwin系列OSでは動作しないので、cent OSに導入した。binaryにパスを通しておく。
実行方法
Step 1: Quality profile generation
genProfile -R <read tag(1 for R1, 2 for R2)> -l <read length> <input.txt>順番で記載する。
genProfile -R 1 -l 100 input.txt
Step 2: Simulation of SNPs, INDELs, CNVs
SInC_simulate ref.fasta
Example:
./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2
Step 3: Read generation
SInC_readGen [options] <in.ref.fa> <read_1_profile.txt> <read_2_prof.txt>
Example:
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
引用
SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data
Pattnaik S, Gupta S, Rao AA, Panda B
BMC Bioinformatics. 2014 Feb 5;15:40