macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

並列化で高速に動作するシミュレーター SlnC

 

 SlnCは最も多い変異であるSNV、indel、CNVをシミュレートできるNGSのリードシミュレーションツール。マルチコアに対応しており、ARTのようなツールと比較して高速にカバレッジのディープなデータセットを発生させることができる。

  

ダウンロード

依存

brewで導入できる。

SourceForge (Binaryのみ)

https://sourceforge.net/p/sincsimulator/code/ci/master/tree/

git clone https://git.code.sf.net/p/sincsimulator/code sincsimulator-code

注: mac OSXのようなDarwin系列OSでは動作しないので、cent OSに導入した。binaryにパスを通しておく。

 

実行方法

Step 1: Quality profile generation

genProfile -R <read tag(1 for R1, 2 for R2)> -l <read length> <input.txt>順番で記載する。

genProfile -R 1 -l 100 input.txt

 

 Step 2: Simulation of SNPs, INDELs, CNVs

SInC_simulate ref.fasta

Example:

./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2

 

 Step 3: Read generation

SInC_readGen [options] <in.ref.fa> <read_1_profile.txt> <read_2_prof.txt>  

Example:

./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt

./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt 

 

 

 

引用

SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data

Pattnaik S, Gupta S, Rao AA, Panda B

BMC Bioinformatics. 2014 Feb 5;15:40

 

SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data. - PubMed - NCBI