2021 7/11 link追加
REAPRは、リファレンスゲノムを使わずゲノムアセンブリの精度を評価するツール。カバレッジおよびインサートサイズの分布などのマッピング情報を分析して、ミスアセンブリの位置が特定される。 誤ったアセンブリはレポートされ、新しいアセンブリが出力される。 解析にはFASTA形式のアセンブリと、アセンブリにマップされたペアのBAMファイルが必要となる。 大きなインサートサイズのマッピング情報(≥1000bp)がある時に最適に機能する。
HP
https://www.sanger.ac.uk/tool/reapr/
マニュアル
ftp://ftp.sanger.ac.uk/pub/resources/software/reapr/Reapr_1.0.18.manual.pdf
インストール
ubuntu14.04にインストールした。
依存
- R
- perl
- File::Basename
- File::Copy
- File::Spec
- File::Spec::Link
- Getopt::Long
- List::Util
perlのモジュールで持ってないものがあれば、cpanmでインストールしておく。
cpanm xxx
#またはCPANに入って(CPANとうつ)
>install File::Spec::Link
#または作者のサイトやCPANからダウンロード
perl Makefile.PL
make make
test make #OKが出るか確認
sudo make install
本体はパッケージマネージャで導入できる。
sudo apt install reapr
自分でビルドするならサンガー研の公式サイトからダウンロードする。
http://www.sanger.ac.uk/science/tools/reapr
解凍して以下のように打つ。
cd Reapr_1.0.18
./install.sh #perlライブラリが入ってるかチェックし、OKならビルドが始まる
src/にreapr.plができる。
ラン
テストデータを公式からダウンロードして解凍する。
中に入り、./test.shと打つ。
cd Reapr_1.0.18.test_data
./test.sh
引用
REAPR: a universal tool for genome assembly evaluation
Martin Hunt, Taisei Kikuchi, Mandy Sanders, Chris Newbold, Matthew Berriman and Thomas D Otto
Genome Biology 2013 14:R47
利用例