macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

エラーコレクションツール FMOC

 

FMOCは(bwaやbowtieも使っている)FMインデックスを使ったエラー補正の方法論。ハイクオリティなデータセットであるなら、エラー補正能の感度は高いとされる。計算にかかる時間はKarectと同等(karectリンク)。

 

インストール

cent OSに導入した。

本体 Github 

git clone https://github.com/ythuang0522/FMOC.git
cd FMOC/
./autogen.sh
./configure
make -j 8

cd FMOC/
./FMOC -h

$ FMOC

Program: FMOC

Version: 0.0.1

Contact: Yao-Ting Huang [ythuang@cs.ccu.edu.tw]

Usage: FMOE <command> [options]

 

      preprocess  filter and quality-trim reads

      index       build FM-index for a set of reads

      correct     correct sequencing errors in reads 

 

 

実行方法

fastqはfastaに変換して使用する。

FMOC preprocess --discard-quality -p 1 R1.fq R2.fq -o InputFile.fa

ペアリードのfastqからfastaが出力される。

 

次にindexを作成。

FMOC index -t 20 InputFile.fa

 

エラー補正。

FMOC correct -t 20 -k 31 -K 15 InputFile.fa -o OutputFile.fa

OutputFile.faが出力される。

 

引用

An efficient error correction algorithm using FM-index

Yao-Ting Huan, Yu-Wen Huang

BMC Bioinformatics. 2017; 18: 524.