macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ハイブリッドアセンブルを行うquickmerge

 

quickmergeは、ロングリード情報を使い、アセンブルcontiguityを向上させるツール。特にロングリードのカバレッジがmodestな時にcontiguityが大きく向上するとされる。他のツールのアセンブル結果を入力ファイルとする。

 

インストール

Github

https://github.com/mahulchak/quickmerge

git clone https://github.com/mahulchak/quickmerge.git
cd quickmerge
bash make_merger.sh

 

実行方法

使用するには、DBG2OLC(紹介)などで実行されたハイブリッドアセンブリされたデータと、ロングリードだけでアセンブルされたデータが必要となる。オーサーらはハイブリッドアセンブリにはDBG2OLCを用い、ロングリードだけのアセンブリにはPBcR、canu、FALCONなどを用いている。

 

ラッパーツールを用いたランが推奨されている。

 merge_wrapper.py hybrid_assembly.fasta self_assembly.fasta

 マニュアルで進めることも可能です。詳細はオーサーらの説明を参考にしてください。

https://github.com/mahulchak/quickmerge

  

発表された論文では、high qualityなゲノムの抽出からアセンブルのpolishまで一通りの流れが書かれており勉強になります。

 

引用

Contiguous and accurate de novo assembly of metazoan genomes with modest long read coverage

Mahul Chakraborty James G. Baldwin-Brown Anthony D. Long J. J. Emerson

Nucleic Acids Research, Volume 44, Issue 19, 2 November 2016, Pages e147,