macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Iontorrentのエラーコレクションを行う IonHammer

 

 IonTorrentのリードエラー修正アルゴリズムを用いて、幅広いデータセットのシーケンシングエラーを大幅に削減することができる。IonHammerはC++で実装されており、SPAdesゲノムアセンブラパッケージの一部として自由に利用できる。

 

インストール

mac os 10.14でコンパイル済みのプログラムをダウンロードしてテストした。

Github

 バイナリをダウンロードするかconda/brewでインストールする。

#3.14.0 linux
wget http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz
tar -xzf SPAdes-3.14.0-Linux.tar.gz
cd SPAdes-3.14.0-Linux/bin/

#3.14.0 darwin
curl http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Darwin.tar.gz -o SPAdes-3.14.0-Darwin.tar.gz
tar -zxf SPAdes-3.14.0-Darwin.tar.gz
cd SPAdes-3.14.0-Darwin/bin/


#bioconda(link)
conda install -c bioconda -y sppades

#homebrew
brew install spades

 

実行方法

--iontorrentをつけてspadesを実行する(iontorrentのシーケンシングデータ以外に使わない事)。

spades.py --iontorrent -s input.fq.gz -o output_dir -t 12 -k auto
  • --iontorrent    This flag is required when assembling IonTorrent data. Allows BAM files as input. Carefully read section 3.3 before using this option. 
  • -t     number of threads-t/--threads <int> number of threads [default: 16]
  • -k    comma-separated list of k-mer sizes (must be odd and-k <int,int,...> comma-separated list of k-mer sizes (must be odd and less than 128) [default: 'auto']
  • -s    file with unpaired reads

 

エラー修正のみ行う。

spades.py --iontorrent -s input.fq.gz -o output_dir -t 12 --only-error-correction
  • --iontorrent    This flag is required when assembling IonTorrent data. Allows BAM
  • --only-error-correction   runs only read error correction (without assembling)

 

引用

IonHammer: Homopolymer-Space Hamming Clustering for IonTorrent Read Error Correction
Vasily Ershov, Artem Tarasov, Alla Lapidus, Anton Korobeynikov

Journal of Computational Biology.  Published Online: 6 Feb 2019

 

SPAdesアセンブラ自体は以前紹介しました。