macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Reference-assisted assembly3 ABACAS

 

ABACASはサンガー研の開発したReference-assisted assemblyなアセンブル法である。2009年に論文が発表された。サンガー研のACTやMummerの機能と連携しており、ランと結果の分析にはこの2つがインストールされている必要がある。その他の特徴として、primer3を使ったgap closingのためのprimer自動設計支援機能も備えている。

  

ダウンロード

依存

  • Mumer
  • Artemis Comparison Tool: ACT)(ABCAS解析後に使うなら)
  • primer3(ABCAS解析後に使うなら)

配列を比較してソートするためにMummerのプログラムが必要である。ABACASは出力をACTに読み込んで参照したゲノムとそのまま比較できるように設計されているため、ACTも導入されていることが望ましい。

  • ACTは以前紹介した。

  • Nucmerも紹介予定(現在加筆中)

  • primer3はbrewでインストール可能である。
brew install primer3

 

ABACAS本体はHPからダウンロードできる(ABACASダウンロード直リンク)。

 

マニュアル

ポスター

 

ラン

ABACASは単一のperlプログラムである。アセンブルして作ったcontigと、参照するリファレンスを指定してランする。

perl abacas.1.3.1.pl -r ref.fa -q contig.fa -p nucmer
  • -r reference sequence in a single fasta file
  • -q contigs in multi-fasta format
  • -p MUMmer program to use: 'nucmer' or 'promer'

  

ragoutのexampleとして提供されているMG1655-K12のcontigとリファレンス配列(MG1655-K12)を使用して、ABACASをランしてみた。

ACTを用いて、出力されたscaffoldsを参照したk12のゲノムと比較したのが以下である。f:id:kazumaxneo:20170629131433j:plain

 全体として、順序はK12通りになっている。簡易的にゲノムが構築された。ただし、今回は正解がわかっているので正しいと言えるが、実際の解析でリファレンス通りになったからといって正しいかどうかは補償の限りではない。 

 

 

ABACASは、gapをcloseせずにprimer3を使いprimerを設計する機能も備えている。

-eをつけてgap間の繋がりを確認するprimerを設計する。

perl abacas.1.3.1.pl -r ref.fa -q contig.fa -p nucmer -e

ランの途中primerのパラメータについて質問される(赤い部分)。

***********************************************************************************                                            

* ABACAS: Algorithm Based Automatic Contiguation of Assembled Sequences           *                                            

*                                                                                 *                                            

*                                                                                 *                                            

*   Copyright (C) 2008-10 The Wellcome Trust Sanger Institute, Cambridge, UK.     *                                            

*   All Rights Reserved.                                                          *                                            

*                                                                                 *                                            

***********************************************************************************                                            

 

Primer design selected,... escaping contig ordering            

Primers without ordering..     

/Users/user/local/ragout-2.0-macos-x86_64/examples/E.Coli/references/MG1655-K12.fasta                                          

Enter Optimum Primer size (default 20 bases):20                

 

Enter Minimum Primer size (default 18 bases):18                

 

Enter Maximum Primer size (default 27 bases):30                

 

Enter Optimum melting temperature (Celcius) for a primer oligo (default 60.0C):60.0C                                           

 

Enter Minimum melting temperature (Celcius) for a primer oligo (default 57.0C):55.0C                                           

 

Enter Maximum melting temperature (Celcius) for a primer oligo (default 63.0C):65.0C                                           

 

Enter flanking region size (default 1000 bases): 1000          

 

Enter minimum product size produced by primers (default =flanking size):1000                                                   

 

Enter maxmimum product size produced by primers (default 7000):7000                                                            

 

Enter minimum GC content in primers (default 20%):20           

 

Enter optimum GC content in primers (default 50%):50           

 

Enter maximum GC content in primers (default 80%):80           

 

Enter GC clamp  (default 1):1  

 

Enter size of region to exclude at the end of contigs (default 100 bases):100                                                  

 

 

 

Please wait... extracting target regions ...                   

 

 ただし、上記のデータでは出力がゼロになった。原因はgapをゼロと認識していることになる(実際はgapはゼロでない。-eなしでランすると、.fasta.gapsにcontigの数とほぼ同じ数のgapが認識され、scaffoldsも構築される)。 

 

 

 

引用

ABACAS: algorithm-based automatic contiguation of assembled sequences.

Assefa S1, Keane TM, Otto TD, Newbold C, Berriman M.

Bioinformatics. 2009 Aug 1;25(15):1968-9. doi: 10.1093/bioinformatics/btp347. Epub 2009 Jun 3.

https://www.ncbi.nlm.nih.gov/pubmed/19497936