palfinderはマイクロサテライトやsimple sequence repeats (SSRs)を探すツール。454やilluminaのNGSデータから直接マイクロサテライトを検出し、さらに内部でprimer3を動かし、その増幅プライマーを設計する機能を備える。
インストール
依存
- primer3
primer3はbrewでインストールできる。
brew install primer3
本体のダウンロード
https://sourceforge.net/projects/palfinder/?source=typ_redirect
実行方法
ランはconfig.txtのパラメータを元に行われる。また、単純リピートをprimer3設計サイトから排除するために、単純リピートをリスト化したファイルも必要となる (simple.ref)。
configファイルは以下のようなものを記載する。
neo$ cat config.txt
# config.txt
findPrimers 1 #プライマーも設計したいなら1、マイクロサテライトのstatisticsだけなら0
platform Illumina #454かilljuminaを記載
inputFormat fastq
pairedEnd 1 #ペアリードなら1、そうでないなら0。454はシングル、illuminaはペアのみ対応
input454reads test/data/454_All_python.fna #454データのパス。formatはFASTA(illuminaならこの項目は不要)
inputReadFile test/data/IlluminaPE_SG_10k_1.fq #illuminaデータのパス。フォワードリード。scarf format。(454ならこの項目は不要)
pairedReadFile test/data/IlluminaPE_SG_10k_2.fq #リバースリード
MicrosatSumOut test/output/test_microsat_summary.txt #出力パス
PALsummaryOut test/output/test_PAL_summary.txt #出力パス
2merMinReps 6 #2mer単位のリピートの最低繰り返し数。以下だと検出しない。
3merMinReps 0 #3mer
4merMinReps 0
5merMinReps 0
6merMinReps 0
primer3input test/output/pr3in.txt #primer3一時ファイル1
primer3output test/output/pr3out.txt #primer3一時ファイル2
keepPrimer3files 0 #primer3一時ファイル3
primer3executable /usr/local/bin/primer3_core #プライマー3コアのパス
prNamePrefix test_ #primer名。これだとtest_という名前になる。
#-------------------- primer3 Parameters ---------------------#
PRIMER_TASK pick_pcr_primers
PRIMER_OPT_SIZE 20
PRIMER_MIN_SIZE 18
PRIMER_MAX_SIZE 30
PRIMER_MAX_NS_ACCEPTED 0
pr3ProductSizeRangeMinVal 60
pr3ProductSizeRangeMaxVal 500
PRIMER_OPT_SIZE 20
PRIMER_MIN_GC 30.0
PRIMER_MAX_GC 80.0
PRIMER_MAX_END_GC 5
PRIMER_MIN_TM 58.0
PRIMER_MAX_TM 65.0
PRIMER_OPT_TM 62.0
PRIMER_PAIR_MAX_DIFF_TM 2.0
PRIMER_TM_FORMULA 0
PRIMER_MAX_SELF_ANY 8.00
PRIMER_PAIR_MAX_COMPL_ANY 8.00
PRIMER_MAX_SELF_END 3.00
PRIMER_PAIR_MAX_COMPL_END 3.00
PRIMER_MAX_POLY_X 4
PRIMER_LOWERCASE_MASKING 0
PRIMER_NUM_RETURN 1
PRIMER_MISPRIMING_LIBRARY simple.ref
PRIMER_MAX_LIBRARY_MISPRIMING 10.00
PRIMER_LIB_AMBIGUITY_CODES_CONSENSUS 0
ランはconfigファイルを指定して行う。
perl pal_finder_v0.02.04.pl config.txt
出力
454リードからの探索結果。
マイクロサテライト予測結果サマリー。
引用
Rapid Microsatellite Identification from Illumina Paired-End Genomic Sequencing in Two Birds and a Snake
Todd A. Castoe,1 Alexander W. Poole,1 A. P. Jason de Koning,1 Kenneth L. Jones,1 Diana F. Tomback,2 Sara J. Oyler-McCance,3 Jennifer A. Fike,3 Stacey L. Lance,4 Jeffrey W. Streicher,5 Eric N. Smith,5 and David D. Pollock1,*
PLoS One. 2012; 7(2): e30953.