macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

リードをマッピングしてゲノムアセンブリの精度を評価する REAPR

 

REAPRは、リファレンスゲノムを使わずゲノムアセンブリの精度を評価するツール。カバレッジおよびインサートサイズの分布などのマッピング情報を分析して、ミスアセンブリの位置が特定される。 誤ったアセンブリはレポートされ、新しいアセンブリが出力される。 解析にはFASTA形式のアセンブリと、アセンブリにマップされたペアのBAMファイルが必要となる。 大きなインサートサイズのマッピング情報(≥1000bp)がある時に最適に機能する。

 

 マニュアル

ftp://ftp.sanger.ac.uk/pub/resources/software/reapr/Reapr_1.0.18.manual.pdf

 

インストール

ubuntu14.04にインストールした。

依存

  • R
  • perl
  • File::Basename
  • File::Copy
  • File::Spec
  • File::Spec::Link
  • Getopt::Long
  • List::Util

perlのモジュールで持ってないものがあれば、cpanmでインストールしておく。

cpanm xxx

#またはCPANに入って(CPANとうつ)
>install File::Spec::Link

#または作者のサイトやCPANからダウンロード
perl Makefile.PL
make make
test make #OKが出るか確認
sudo make install

 

本体はパッケージマネージャで導入できる。

sudo apt install reapr

自分でビルドするならサンガー研の公式サイトからダウンロードする。

http://www.sanger.ac.uk/science/tools/reapr

解凍して以下のように打つ。

cd Reapr_1.0.18 
./install.sh #perlライブラリが入ってるかチェックし、OKならビルドが始まる

src/にreapr.plができる。

f:id:kazumaxneo:20180201173044p:plain

 

 ラン

テストデータを公式からダウンロードして解凍する。

中に入り、./test.shと打つ。

cd Reapr_1.0.18.test_data 
./test.sh

  

引用

REAPR: a universal tool for genome assembly evaluation

Martin Hunt, Taisei Kikuchi, Mandy Sanders, Chris Newbold, Matthew Berriman and Thomas D Otto

Genome Biology 2013 14:R47