IonTorrentのリードエラー修正アルゴリズムを用いて、幅広いデータセットのシーケンシングエラーを大幅に削減することができる。IonHammerはC++で実装されており、SPAdesゲノムアセンブラパッケージの一部として自由に利用できる。
インストール
mac os 10.14でコンパイル済みのプログラムをダウンロードしてテストした。
バイナリをダウンロードするかconda/brewでインストールする。
#3.14.0 linux
wget http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz
tar -xzf SPAdes-3.14.0-Linux.tar.gz
cd SPAdes-3.14.0-Linux/bin/
#3.14.0 darwin
curl http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Darwin.tar.gz -o SPAdes-3.14.0-Darwin.tar.gz
tar -zxf SPAdes-3.14.0-Darwin.tar.gz
cd SPAdes-3.14.0-Darwin/bin/
#bioconda(link)
conda install -c bioconda -y sppades
#homebrew
brew install spades
実行方法
--iontorrentをつけてspadesを実行する(iontorrentのシーケンシングデータ以外に使わない事)。
spades.py --iontorrent -s input.fq.gz -o output_dir -t 12 -k auto
- --iontorrent This flag is required when assembling IonTorrent data. Allows BAM files as input. Carefully read section 3.3 before using this option.
- -t number of threads-t/--threads <int> number of threads [default: 16]
- -k comma-separated list of k-mer sizes (must be odd and-k <int,int,...> comma-separated list of k-mer sizes (must be odd and less than 128) [default: 'auto']
- -s file with unpaired reads
エラー修正のみ行う。
spades.py --iontorrent -s input.fq.gz -o output_dir -t 12 --only-error-correction
- --iontorrent This flag is required when assembling IonTorrent data. Allows BAM
- --only-error-correction runs only read error correction (without assembling)
引用
IonHammer: Homopolymer-Space Hamming Clustering for IonTorrent Read Error Correction
Vasily Ershov, Artem Tarasov, Alla Lapidus, Anton Korobeynikov
Journal of Computational Biology. Published Online: 6 Feb 2019
SPAdesアセンブラ自体は以前紹介しました。