macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

アダプター配列を自動検出し、トリミングするPEAT

 

PEATはアダプターの自動トリミングツール。アダプター配列を入力しなくても、頻出する配列を自動で探し出してトリミングを実行する。並列化にも対応しており、高速なトリミングが可能である。論文中ではChIP-seq、MNase-seq、およびRNA-seqなどのデータを使って検証が行われている。

 

Github

https://github.com/jhhung/PEAT

 

インストール

Githubのリリースから適切なバイナリをダウンロード。実行権をつけておく。

Releases · jhhung/PEAT · GitHub

chmod u+x PEAT_mac_v1.2.4

./PEAT_mac_v1.2.4 #動作確認

$ ./PEAT_mac_v1.2.4 

 

 

*********************************************************************************

+----+

|PEAT|

+----+

  A integrated software that can do either paired-end and single-end adapter trimming operation.  

 

Usage:

 

 1. paired-end adapter trimming

> PEAT paired --help

  

 2. single-end adapter trimming

> PEAT single --help

*********************************************************************************

パスの通ったディレクトリに移動させる。

 

 

ラン

アダプター配列をトリミングする。fastqを指定する。

PEAT paired -1 pair1.fastq -2 pair2.fastq -o top50report -n 12 --adapter_min_bp 10 --adapter_contexts --verbose
  • -1 The paired_1 input FastQ file (.fq) or Gzip compressed FASTQ file (.fq.gz).
  • -2 The paired_2 input FastQ file (.fq) or Gzip compressed FASTQ file (.fq.gz).
  • -n <INT> Number of thread to use; if the number is larger than the core available, it will be adjusted automatically
  • -o Prefix for Output file name, stdout by default. If you choose this option, you couldn't use --output_1 and --output_2
  • --adapter_contexts Output adapter contexts within the top ten numbers in report.txt; if you use this option, the program becomes slower.
  • --adapter_min_bp Determine the mininal length of output adapter contexts within the top 50 numbers in report.txt, 10 bp by default; Only for the option: adapter_contexts
  • --verbose Output running process bt stderr

 

検出されたtop50のアダプター配列がプリントされ、その配列がトリムされたfastqが出力される。

f:id:kazumaxneo:20171219122730j:plain

 

 

 

引用

PEAT: an intelligent and efficient paired-end sequencing adapter trimming algorithm.

Li YL, Weng JC, Hsiao CC, Chou MT, Tseng CW, Hung JH.

BMC Bioinformatics. 2015;16 Suppl 1:S2. doi: 10.1186/1471-2105-16-S1-S2. Epub 2015 Jan 21.