macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

メタゲノムデータを使ってシングルセルのエラー訂正を行う MeCorS

 

 自然界に存在する大部分の微生物種は培養できないが、メタゲノミクスや最近のシングルセルシーケンス技術によりゲノムにアクセスできるようになってきた。シングルセルシーケンスとメタゲノムのショットガンシーケンスが同じ環境サンプルから生成され、方法論的に組み合わせられる。例えば、シングルセルのデータでメタゲノムビンを検証したり、シングルセルのアセンブリのcontiguityをメタゲノムデータで改善したりすることができる(論文より Campbell et al, 2013、Hess et al, 2011)。しかし、通常シングルセルシーケンスを行うにはシーケンシングに先立って全ゲノム増幅する必要がある(MDA; Lasken, 2007)。この増幅はひどく偏っており、超低カバレッジ領域を発生させる(Chitsaz et al., 2011; Supplementary Fig. S1)。さらに、キメラ形成は、MDA中に約10kbp当たり約1回発生し、single amplified genomes (SAGs) をさらに複雑にする(Nurk et al, 2013、Rodrigue et al, 2009)。さまざまなケースのためのエラーコレクションツールが存在するが、SAGデータをエラー訂正するために特別に設計されたツールはhammer (Medvedev et al., 2011)(のちにBayesHammer (Nikolenko、2013)としてリファインされた)しか存在しない。

 MeCorSはシングルセルシーケンスのためのメタゲノム対応エラー訂正ツール。カバレッジバイアスのないメタゲノムデータを利用し、SAGの超低カバレッジ領域のエラー訂正を行う。またキメラのないメタのゲムデータを使い、キメラのSAGを訂正する。

 

インストール

cent OSに導入した。

本体 Github

https://github.com/metagenomics/MeCorS

git clone https://github.com/metagenomics/MeCorS.git 
cd MeCorS && make

> ./mecors 

$ ./mecors

MeCorS version 0.4.1 by Andreas Bremges (andreas@cebitec.uni-bielefeld.de)

 

Usage: mecors [options] -s <SC.fastq> -m <MG.fastq>

 

       -s <SC.fastq>  single cell sequencing reads

       -m <MG.fastq>  metagenomic sequencing reads

                      (fastq or fasta, can be gzip'ed)

 

       -k INT         k-mer size for error correction [31]

       -c INT         min. coverage in the metagenome [2]

 

       -t INT         number of threads [16]

       -B NUM         process ~NUM bp in each batch [100M]

       -v             be verbose

パスの通ったディレクトリにコピーしておく。

 

ラン

シングルセルとメタゲノムのfastqを指定して実行する。

mecors [options] -s single_cell.fq -m metagenome.fq
  • -s   single cell sequencing reads
  • -m   metagenomic sequencing reads (fastq or fasta, can be gzip'ed)
  • -k    k-mer size for error correction [31]
  • -c    min. coverage in the metagenome [2]
  • -t    number of threads [16]
  • -B    process ~NUM bp in each batch [100M]
  • -v    be verbose

 

引用

MeCorS: Metagenome-enabled error correction of single cell sequencing reads.

Bremges A, Singer E, Woyke T, Sczyrba A

Bioinformatics. 2016 Jul 15;32(14):2199-201.