自然界に存在する大部分の微生物種は培養できないが、メタゲノミクスや最近のシングルセルシーケンス技術によりゲノムにアクセスできるようになってきた。シングルセルシーケンスとメタゲノムのショットガンシーケンスが同じ環境サンプルから生成され、方法論的に組み合わせられる。例えば、シングルセルのデータでメタゲノムビンを検証したり、シングルセルのアセンブリのcontiguityをメタゲノムデータで改善したりすることができる(論文より Campbell et al, 2013、Hess et al, 2011)。しかし、通常シングルセルシーケンスを行うにはシーケンシングに先立って全ゲノム増幅する必要がある(MDA; Lasken, 2007)。この増幅はひどく偏っており、超低カバレッジ領域を発生させる(Chitsaz et al., 2011; Supplementary Fig. S1)。さらに、キメラ形成は、MDA中に約10kbp当たり約1回発生し、single amplified genomes (SAGs) をさらに複雑にする(Nurk et al, 2013、Rodrigue et al, 2009)。さまざまなケースのためのエラーコレクションツールが存在するが、SAGデータをエラー訂正するために特別に設計されたツールはhammer (Medvedev et al., 2011)(のちにBayesHammer (Nikolenko、2013)としてリファインされた)しか存在しない。
MeCorSはシングルセルシーケンスのためのメタゲノム対応エラー訂正ツール。カバレッジバイアスのないメタゲノムデータを利用し、SAGの超低カバレッジ領域のエラー訂正を行う。またキメラのないメタのゲムデータを使い、キメラのSAGを訂正する。
インストール
cent OSに導入した。
本体 Github
https://github.com/metagenomics/MeCorS
git clone https://github.com/metagenomics/MeCorS.git
cd MeCorS && make
> ./mecors
$ ./mecors
MeCorS version 0.4.1 by Andreas Bremges (andreas@cebitec.uni-bielefeld.de)
Usage: mecors [options] -s <SC.fastq> -m <MG.fastq>
-s <SC.fastq> single cell sequencing reads
-m <MG.fastq> metagenomic sequencing reads
(fastq or fasta, can be gzip'ed)
-k INT k-mer size for error correction [31]
-c INT min. coverage in the metagenome [2]
-t INT number of threads [16]
-B NUM process ~NUM bp in each batch [100M]
-v be verbose
パスの通ったディレクトリにコピーしておく。
ラン
シングルセルとメタゲノムのfastqを指定して実行する。
mecors [options] -s single_cell.fq -m metagenome.fq
- -s single cell sequencing reads
- -m metagenomic sequencing reads (fastq or fasta, can be gzip'ed)
- -k k-mer size for error correction [31]
- -c min. coverage in the metagenome [2]
- -t number of threads [16]
- -B process ~NUM bp in each batch [100M]
- -v be verbose
引用
MeCorS: Metagenome-enabled error correction of single cell sequencing reads.
Bremges A, Singer E, Woyke T, Sczyrba A
Bioinformatics. 2016 Jul 15;32(14):2199-201.