macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

velvetのベストなk-merを自動で決めてアセンブルするvelvetoptimiser

velvetoptimiserは自動でk-merを振ってKmer coverage を調べ、velvetのアセブルにベストと思われるk-merのサイズを決め、アセンブルまで自動で行うラッパーツール。Velvetkよりもっと便利に使える。

 

Githubのダンウロードリンク。

GitHub - tseemann/VelvetOptimiser: Automatically optimise three of Velvet's assembly parameters.

wikiリンク

https://wiki.gacrc.uga.edu/wiki/VelvetOptimiser

 

macでもvelvetとBioperlをインストールしていれば動く。BioperlCPANで検索してダウンロード&インストールする(CPANリンク)。

 

MiSeqペアードエンドデータをアセンブルするなら

perl VelvetOptimiser.pl -s 19 -e 151 -x 8 -f '-fastq -shortPaired R1.fq R2.fq'
  • --s The starting (lower) hash value (default '19').
  • --e The end (higher) hash value (default '99').
  • --x  The step in hash search.. min 2, no odd numbers (default '2').

 

--sで検討する最小のk-merサイズ、--eで検討する最大のk-merサイズを指定する。この例だとk=19から始まり、k=8刻みでk=151まで検討することになる。最大サイズは当然リードよりも短くする必要がある。アセンブルは自分で行うが、velvetに限らず最適なk-merサイズを調べたければ、kmergenieが使いやすい。パスを通しておけば、kmergenie input.fqだけでk-merのヒストグラムを描いてくれる。

 

kmergenieについては、日本の方の記事リンクを貼っておきます。