macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

アセンブル結果の分析および統合を行う CAMSA

 

 ドライの計算技術およびウエット実験技術を利用して、ドラフトゲノムからゲノムを再構築する様々な方法が存在するが、それらはアセンブリの一部のみを生成する。したがって、異なる方法によって作製されたアセンブリ結果を比較して統合することが重要となるが、手動で実行するとかなりの労力がかかる。CAMSAは2つ以上のアセンブリの比較分析および統合のためのツール。統合されたscaffoldsを構築し、いくつかのアセンブリメトリックを含む広範なレポートも作成する。

 

公式ページ

https://cblab.org/camsa/

入力ファイル

https://github.com/compbiol/CAMSA/wiki/Input

 

インストール 

Github

github.com

pipで導入できる。

sudo pip install CAMSA
run_camsa.py --help #テストラン

  

実行方法

まずコンティグのFASTAファイルをCAMSAの入力フォーマットに変換する。

fasta2camsa_points.py contigs.fasta scaffolds.fasta -o OUTDIR 
  • -o OUTPUT_DIR Output directory to store temporary and final files.

f:id:kazumaxneo:20171128191245j:plain

 scaffolds.camsa.pointsができる。

 

run_camsa.py f1.camsa.points -o output_dir

インタラクティブな分析htmlレポートも出力される。

f:id:kazumaxneo:20180320213134j:plain

 

引用

CAMSA: a Tool for Comparative Analysis and Merging of Scaffold Assemblies

Sergey S. Aganezov, Max A. Alekseyev

BMC Bioinformatics. 2017; 18(Suppl 15): 496.