macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

並列化で高速に動作するシミュレーター SlnC

 

 SlnCは最も多い変異であるSNV、indel、CNVをシミュレートできるNGSのリードシミュレーションツール。マルチコアに対応しており、ARTのようなツールと比較して高速にカバレッジのディープなデータセットを発生させることができる。

 

 

ダウンロード

依存

brewで導入できる。

SourceForge (Binaryのみ)

https://sourceforge.net/p/sincsimulator/code/ci/master/tree/

git clone https://git.code.sf.net/p/sincsimulator/code sincsimulator-code

注: mac OSXのようなDarwin系列OSでは動作しないので、cent OSに導入した。binaryにパスを通しておく。

 

ラン

 Step 1: Quality profile generation

genProfile -R <read tag(1 for R1, 2 for R2)> -l <read length> <input.txt>順番で記載する。

genProfile -R 1 -l 100 input.txt

 

 

Step 2: Simulation of SNPs, INDELs, CNVs

SInC_simulate ref.fasta

Example:

./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2

 

  

Step 3: Read generation

SInC_readGen [options] <in.ref.fa> <read_1_profile.txt> <read_2_prof.txt>  

Example:

./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt

./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt 

 

 

 

 

 

引用

SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data.

Pattnaik S, Gupta S, Rao AA, Panda B1.

BMC Bioinformatics. 2014 Feb 5;15:40. doi: 10.1186/1471-2105-15-40.

 

SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data. - PubMed - NCBI