macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

マイクロサテライトをraw readsから直接探すpalfinder

 

 palfinderはマイクロサテライトやsimple sequence repeats (SSRs)を探すツール。454やilluminaのNGSデータから直接マイクロサテライトを検出し、さらに内部でprimer3を動かし、その増幅プライマーを設計する機能を備える。

 

インストール

依存

  • primer3

primer3はbrewでインストールできる。

brew install primer3

 本体のダウンロード

https://sourceforge.net/projects/palfinder/?source=typ_redirect

 

実行方法

ランはconfig.txtのパラメータを元に行われる。また、単純リピートをprimer3設計サイトから排除するために、単純リピートをリスト化したファイルも必要となる (simple.ref)。

configファイルは以下のようなものを記載する。

neo$ cat config.txt

 

# config.txt

 

findPrimers 1 #プライマーも設計したいなら1、マイクロサテライトのstatisticsだけなら0

platform Illumina #454かilljuminaを記載

inputFormat fastq

pairedEnd  1 #ペアリードなら1、そうでないなら0。454はシングル、illuminaはペアのみ対応

input454reads  test/data/454_All_python.fna #454データのパス。formatはFASTA(illuminaならこの項目は不要)

inputReadFile  test/data/IlluminaPE_SG_10k_1.fq #illuminaデータのパス。フォワードリード。scarf format。(454ならこの項目は不要)

pairedReadFile  test/data/IlluminaPE_SG_10k_2.fq #リバースリード

MicrosatSumOut  test/output/test_microsat_summary.txt #出力パス

PALsummaryOut  test/output/test_PAL_summary.txt #出力パス

2merMinReps 6 #2mer単位のリピートの最低繰り返し数。以下だと検出しない。

3merMinReps 0 #3mer

4merMinReps 0

5merMinReps 0

6merMinReps 0

primer3input  test/output/pr3in.txt #primer3一時ファイル1

primer3output  test/output/pr3out.txt #primer3一時ファイル2

keepPrimer3files  0 #primer3一時ファイル3

primer3executable  /usr/local/bin/primer3_core #プライマー3コアのパス

prNamePrefix  test_ #primer名。これだとtest_という名前になる。

 

 

#-------------------- primer3 Parameters ---------------------#

PRIMER_TASK  pick_pcr_primers

PRIMER_OPT_SIZE  20

PRIMER_MIN_SIZE  18

PRIMER_MAX_SIZE  30

PRIMER_MAX_NS_ACCEPTED  0

pr3ProductSizeRangeMinVal  60

pr3ProductSizeRangeMaxVal  500

PRIMER_OPT_SIZE  20

PRIMER_MIN_GC  30.0

PRIMER_MAX_GC  80.0

PRIMER_GC_CLAMP  2

PRIMER_MAX_END_GC  5

PRIMER_MIN_TM  58.0

PRIMER_MAX_TM  65.0

PRIMER_OPT_TM  62.0

PRIMER_PAIR_MAX_DIFF_TM  2.0

PRIMER_TM_FORMULA  0

PRIMER_MAX_SELF_ANY  8.00

PRIMER_PAIR_MAX_COMPL_ANY  8.00

PRIMER_MAX_SELF_END  3.00

PRIMER_PAIR_MAX_COMPL_END  3.00

PRIMER_MAX_POLY_X  4

PRIMER_LOWERCASE_MASKING  0 

PRIMER_NUM_RETURN  1

PRIMER_MISPRIMING_LIBRARY  simple.ref

PRIMER_MAX_LIBRARY_MISPRIMING  10.00

PRIMER_LIB_AMBIGUITY_CODES_CONSENSUS   0

 

ランはconfigファイルを指定して行う。 

perl pal_finder_v0.02.04.pl config.txt

 

出力

454リードからの探索結果。

f:id:kazumaxneo:20170925003448j:plain

マイクロサテライト予測結果サマリー。

f:id:kazumaxneo:20170925003607j:plain

 

引用

Rapid Microsatellite Identification from Illumina Paired-End Genomic Sequencing in Two Birds and a Snake

Todd A. Castoe,1 Alexander W. Poole,1 A. P. Jason de Koning,1 Kenneth L. Jones,1 Diana F. Tomback,2 Sara J. Oyler-McCance,3 Jennifer A. Fike,3 Stacey L. Lance,4 Jeffrey W. Streicher,5 Eric N. Smith,5 and David D. Pollock1,*

PLoS One. 2012; 7(2): e30953.