macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

置換、indel、ホモポリマーに対応したエラーコレクションツール Pollux

 

PolluxはIllumina、Ion Torrent、Roche 454のシーケンスエラーを訂正する汎用エラーコレクションツール。置換エラーのほかに、挿入、削除、およびホモポリマーのエラーを検出可能である。公開データでテストされており、Illumina MiSeqの94%、Ion Torrent の88%、Roche 454 GS Juniorの85%のエラーを修正し、偽陽性のエラーもtrueより20〜70倍少ないと述べられている。またエラー訂正によりアセンブリの品質が向上することも示されている。

 

インストール

Github

https://github.com/emarinier/pollux

git clone https://github.com/emarinier/pollux.git
cd pollux/
make

 > ./pollux

$ ./pollux

 

Pollux 1.0.2

Source compiled on Feb 19 2018 at 23:55:22.

 

 

USAGE: 

 

ERROR CORRECTION

Required: 

 

-i [file] Specify one or many FASTQ input files.

 

Optional: 

 

-o  Output directory.

-p  Specify input should be treated as paired.

 

-s [bool] Substitution corrections. "true" or "false".

-- [bool] Insertion corrections. "true" or "false".

-d [bool] Deletion corrections. "true" or "false".

-h [bool] Homopolymer corrections. "true" or "false".

-f [bool] Low k-mer read filtering. "true" or "false".

 

-k [int] Specify the k-mer size.

-b [int] Specify the input batch size.

 

FASTK CONVERSION

Required: 

-fastk FASTQ to FASTK file conversion.

-i [file] Specify one or many input files.

 

EXAMPLES: 

 

./error -i file1.fastq

Correct a single file.

 

./error -i file1.fastq file2.fastq file3.fastq

Correct multiple file together.

 

./error -i frag_1.fastq frag_2.fastq -p

Correct two paired files.

 

./error -fastk -i file1.fastq

Convert file1.fastq to FASTK format.

 

 

ラン

ペアードエンドのfastqのエラー補正。

pollux -i pair_1.fastq pair_2.fastq -p -o output
  • -p   Specify input should be treated as paired.
  • -i    Specify one or many input files.
  • -o   Output directory.

 

ペアでない複数fastqのエラー補正。

pollux -i file1.fastq file2.fastq file3.fastq

 

SNV、indel、ホモポリマー、low k-merフィルター全てONにしてペアードエンドのエラー補正。

pollux -i pair_1.fastq pair_2.fastq -p -o output -s true -n true -d true -h true -f true 

 

 

引用

Pollux: platform independent error correction of single and mixed genomes.

Marinier E, Brown DG, McConkey BJ.

BMC Bioinformatics. 2015 Jan 16;16:10.