macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Pacbioのハイブリッドエラーコレクションツール LoRDEC

 

LoRDECはショートリードを使ってロングリードのエラー補正を行う方法論。ロングリード自信によるエラー補正は深いカバレッジを必要とするためコストが高くなるデメリットを持つ。 LoRDECは低コストで高い信頼性をもつショートリードを使い、Pacbioのロングリードのエラー補正を行う。

 

公式HP

http://www.atgc-montpellier.fr/lordec/

wiki

https://gite.lirmm.fr/lordec/lordec-releases/wikis/home

question

https://www.lirmm.fr/~rivals/lordec/FAQ/

 

インストール

condaで導入した。

conda install -c atgc-montpellier lordec

lordec-correct #動作確認

user$ lordec-correct

LoRDEC v0.7

using GATB v1.2.2

website : http://www.atgc-montpellier.fr/lordec/

FAQ : https://www.lirmm.fr/~rivals/lordec/FAQ/

 

Usage :

 

lordec-correct [-t <number of paths to try from a k-mer>] [-b <maximum number of branches to explore>] [-e <maximum error rate>] [-T <number of threads>] [-S <out statistics file>] [-c] -i <long read FASTA/Q file> -2 <short read FASTA/Q file(s)> -k <k-mer size> -o <output reads file> -s <solid k-mer abundance threshold>

  

ラン

Pacbioのロングリードとilluminaのショートリードを指定してエラー補正。

lordec-correct -2 illumina.fq -k 19 -s 3 -T 12 -i pacbio.fasta -o pacbio-corrected.fasta
  • -2 <short read FASTA/Q file(s)>
  • -T <number of threads>]
  • -o <output reads file>
  • -s <solid k-mer abundance threshold>
  • -k <k-mer size> 

statistics (-sで指定した値以上出現するショートリードのk-merのde Bruijn graphの出力)

lordec-stat -2 illumina.fq -k 19 -s 3 -i pacbio.fasta -S output

 エラー補正されたリードのトリミング

lordec-trim -i corrected_reads_file -o trimmed.fasta

 

引用

LoRDEC: accurate and efficient long read error correction

Leena Salmela Eric Rivals

Bioinformatics, Volume 30, Issue 24, 15 December 2014, Pages 3506–3514,