PolluxはIllumina、Ion Torrent、Roche 454のシーケンスエラーを訂正する汎用エラーコレクションツール。置換エラーのほかに、挿入、削除、およびホモポリマーのエラーを検出可能である。公開データでテストされており、Illumina MiSeqの94%、Ion Torrent の88%、Roche 454 GS Juniorの85%のエラーを修正し、偽陽性のエラーもtrueより20〜70倍少ないと述べられている。またエラー訂正によりアセンブリの品質が向上することも示されている。
インストール
https://github.com/emarinier/pollux
git clone https://github.com/emarinier/pollux.git
cd pollux/
make
> ./pollux
$ ./pollux
Pollux 1.0.2
Source compiled on Feb 19 2018 at 23:55:22.
USAGE:
ERROR CORRECTION
Required:
-i [file] Specify one or many FASTQ input files.
Optional:
-o Output directory.
-p Specify input should be treated as paired.
-s [bool] Substitution corrections. "true" or "false".
-- [bool] Insertion corrections. "true" or "false".
-d [bool] Deletion corrections. "true" or "false".
-h [bool] Homopolymer corrections. "true" or "false".
-f [bool] Low k-mer read filtering. "true" or "false".
-k [int] Specify the k-mer size.
-b [int] Specify the input batch size.
FASTK CONVERSION
Required:
-fastk FASTQ to FASTK file conversion.
-i [file] Specify one or many input files.
EXAMPLES:
./error -i file1.fastq
Correct a single file.
./error -i file1.fastq file2.fastq file3.fastq
Correct multiple file together.
./error -i frag_1.fastq frag_2.fastq -p
Correct two paired files.
./error -fastk -i file1.fastq
Convert file1.fastq to FASTK format.
ラン
ペアードエンドのfastqのエラー補正。
pollux -i pair_1.fastq pair_2.fastq -p -o output
- -p Specify input should be treated as paired.
- -i Specify one or many input files.
- -o Output directory.
ペアでない複数fastqのエラー補正。
pollux -i file1.fastq file2.fastq file3.fastq
SNV、indel、ホモポリマー、low k-merフィルター全てONにしてペアードエンドのエラー補正。
pollux -i pair_1.fastq pair_2.fastq -p -o output -s true -n true -d true -h true -f true
引用
Pollux: platform independent error correction of single and mixed genomes.
Marinier E, Brown DG, McConkey BJ.
BMC Bioinformatics. 2015 Jan 16;16:10.