macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

メガサイズのマルチプルアライメントや数千の配列のマルチプルアライメントが可能なFSA

 

  

公式サイト

http://fsa.sourceforge.net

Q&A

FSA Frequently Asked Questions

 

ダウンロード

sorceforge

https://sourceforge.net/projects/fsa/

解凍して、中に入りビルドする。

./configure
make
make install

fsa -h #インストール確認

メガサイズの配列を比較する際にはmummerかexonerate(またはMercator)を使うので、あらかじめbrew等でインストールしておく。  

brew install mummer exonerate

mummer -h #インストール確認
exonerate -h #インストール確認

 

ラン

数百以上の配列(遺伝子)のアライメント

fsa --fast genes.fa --log 7
  •  --log <string> turn on diagnostic logging (-loghelp shows syntax)
  • --gui record alignment & statistical model for interactive Java GUI

--guiをつけると、マルチプルアライメント結果を付属するjavaアプリで描画できる。

 

mummerを使ったゲノムのアライメント

fsa --anchored genome_set.fa --log 7
  •  --anchored use anchoring (--noanchored to disable)

 

exonerateを使ったゲノムのアライメント

fsa --exonerate --softmasked genome_set.fa --log 7
  • --softmasked input sequences are softmasked
  • --exonerate call exonerate to get anchors (implies --anchored)

 

結果のビジュアル化

出力されたinput.fa.guiと使用したfastaを同じディレクトリに入れて以下のように入力のfasta名を打つ。

java -jar fsa-1.15.9/display/mad.jar genes.fa

f:id:kazumaxneo:20171210223250j:plain

 

他の描画ツール(wiki

 

ゲノムサイズのアライメントだとかなりの時間とメモリが要求されます。ご注意ください。

 

アライメントの感度と特異性のトレードオフのバランスをどう取るかについてはQ&Aに記載されています。そちらを参照してください(リンク)。

 

 

引用

Fast Statistical Alignment

Robert K. Bradley , Adam Roberts, Michael Smoot, Sudeep Juvekar, Jaeyoung Do, Colin Dewey, Ian Holmes, Lior Pachter

Published: May 29, 2009https://doi.org/10.1371/journal.pcbi.1000392

 

https://www.biostars.org/p/55961/