PEATはアダプターの自動トリミングツール。アダプター配列を入力しなくても、頻出する配列を自動で探し出してトリミングを実行する。並列化にも対応しており、高速なトリミングが可能である。論文中ではChIP-seq、MNase-seq、およびRNA-seqなどのデータを使って検証が行われている。
https://github.com/jhhung/PEAT
インストール
Githubのリリースから適切なバイナリをダウンロード。実行権をつけておく。
Releases · jhhung/PEAT · GitHub
chmod u+x PEAT_mac_v1.2.4
./PEAT_mac_v1.2.4 #動作確認
$ ./PEAT_mac_v1.2.4
*********************************************************************************
+----+
|PEAT|
+----+
A integrated software that can do either paired-end and single-end adapter trimming operation.
Usage:
1. paired-end adapter trimming
> PEAT paired --help
2. single-end adapter trimming
> PEAT single --help
*********************************************************************************
パスの通ったディレクトリに移動させる。
ラン
アダプター配列をトリミングする。fastqを指定する。
PEAT paired -1 pair1.fastq -2 pair2.fastq -o top50report -n 12 --adapter_min_bp 10 --adapter_contexts --verbose
- -1 The paired_1 input FastQ file (.fq) or Gzip compressed FASTQ file (.fq.gz).
- -2 The paired_2 input FastQ file (.fq) or Gzip compressed FASTQ file (.fq.gz).
- -n <INT> Number of thread to use; if the number is larger than the core available, it will be adjusted automatically
- -o Prefix for Output file name, stdout by default. If you choose this option, you couldn't use --output_1 and --output_2
- --adapter_contexts Output adapter contexts within the top ten numbers in report.txt; if you use this option, the program becomes slower.
- --adapter_min_bp Determine the mininal length of output adapter contexts within the top 50 numbers in report.txt, 10 bp by default; Only for the option: adapter_contexts
- --verbose Output running process bt stderr
検出されたtop50のアダプター配列がプリントされ、その配列がトリムされたfastqが出力される。
引用
PEAT: an intelligent and efficient paired-end sequencing adapter trimming algorithm.
Li YL, Weng JC, Hsiao CC, Chou MT, Tseng CW, Hung JH.
BMC Bioinformatics. 2015;16 Suppl 1:S2. doi: 10.1186/1471-2105-16-S1-S2. Epub 2015 Jan 21.