macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

複数のアセンブラのコンティグをマージする GAM-NGS

 

GAGEのペーパーでも議論されているが、生き物をと言わず常にベストな結果を出すアセンブラと言うのは現状存在しない。アセンブルを改善するため、複数のアセンブル結果をマージしてアセンブル結果を強化するポストアセンブルのツールがいくつか発表されてきている。これらのツールは、近縁種または同一種のリファレンスをガイドとしてアセンブル結果を並べマージするツールと、リファレンスを使用せずconitgをつないだりクラスタリングするツールに分かれ、それぞれいくつかの方法論が発表されている。GAM-NGSは後者に属するツールで、連続性と正確性を向上させるために、リファレンスを使わず2つ以上のアセンブリを統合する。

 

 公式サイト

http://garm-meta-assem.sourceforge.net

 

インストール

cent OSにインストールした。

依存

  • Perl v5.8 or above
  • Parallel::ForkManager
  • List::MoreUtils

perlのモジュールはcpanmでインストールしておく。

cpanm Parallel::ForkManager
cpanm List::MoreUtils

 

 

本体 SourceForge

https://sourceforge.net/projects/garm-meta-assem/files/

 ダウンロードして解凍する。

他の依存は全てダウンロードしたファイルに入っているので、READMEに従って環境変数を定義する。~/.bash_profile(またはbashrc)に以下を追加しておく。

export GARMBIN=/Users/user/Downloads/GARM_v0.7.5/bin/ 
export GARMLIB=/Users/user/Downloads/GARM_v0.7.5/lib/
export MUMBIN=/Users/user/Downloads/GARM_v0.7.5/MUMmer3.22/
export AMOSBIN=/Users/user/Downloads/GARM_v0.7.5/amos-3.0.0/bin/
export AMOSLIB=/Users/user/Downloads/GARM_v0.7.5/amos-3.0.0/lib/
export PATH=$PATH:/Users/user/Downloads/GARM_v0.7.5/

"source ~/.bash_profile"しておく。

準備できたら正常に動くかテストする。

$ perl config.pl 

Your shell is /bin/bash

Configuring GARM env variables

### Your enviromental variables are already defined:

/home/disk1/uesaka/GARM_directory/GARM_v0.7.5/bin/

/home/disk1/uesaka/GARM_directory/GARM_v0.7.5/lib/

/home/disk1/uesaka/GARM_directory/GARM_v0.7.5/MUMmer3.22/

/home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin/

 

### Checking apps

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/MUMmer3.22//nucmer

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//toAmos

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//bank-transact

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//nucmer2ovl

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//sort2

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//tigger

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//make-consensus

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//bank2contig

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//bank2fasta

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//listReadPlacedStatus

OK

Checking /home/disk1/uesaka/GARM_directory/GARM_v0.7.5/amos-3.0.0/bin//dumpreads

OK

 

You can run now GARM without problems :D (hopefully...)

問題ないなら、ランに必要なconfigファイルを準備する。configファイルには1列目にマージしたいcontigのフルパス、2列目に固有の名前を書いておく。

 

ラン

configファイルを指定してランする。

GARM.pl -g config_file -o <prefix>

 

ラン中にエラーがでます。直ったら追記します。

 

引用

GAM-NGS: genomic assemblies merger for next generation sequencing.

Vicedomini R, Vezzi F, Scalabrin S, Arvestad L, Policriti A.

BMC Bioinformatics. 2013;14 Suppl 7:S6.

 

パフォーマンス比較。