macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

web上でマルチプルアライメントを実行し分子系統樹を出力する MAFFT online service

 

 Multiple sequence alignment (MSA)は、biological sequencesの比較分析において重要なステップである。著者らは、MAFFT [論文より ref.1、2]を使用してウェブ上のMSAを計算するためのオンラインサービスを提供する。 MAFFTには、何千ものシーケンスからなる大規模なMSAを計算するためのいくつかの異なるオプションがある。著者らのサービスには、前処理および後処理MSA用のいくつかの追加機能(interactive sequence selectionとphylogenetic inference)もある。また、これらの処理は必要に応じて循環的に行える。この論文では、最近追加された機能やオンラインサービスの使用に関するヒントなど、これらの機能の使用方法について説明する。

 

MAFFTはマルチプルアライメントを行うツール。長期にわたって改良が続けられており、2018年7月現在のバージョンは7となっている。MAFFT online serviceの詳細な使い方は論文に書かれているので、ここでは簡単な流れを紹介する。

 

使い方

MAFFT online serviceにアクセスする。

https://mafft.cbrc.jp/alignment/server/

f:id:kazumaxneo:20180720204603p:plain

ここではMAFFTのテストデータを使う(protein)。

 

ウィンドウに配列をペーストするか、ファイル選択ボタンからアップロードする。

f:id:kazumaxneo:20180720204838p:plain

 

パラメーターを決めたらsubmitボタンを押す。ここではdefaultの設定でランする。

f:id:kazumaxneo:20180720204928p:plain

 

記載されたコマンド条件で解析される。Progress (in a new window)のクリックで進捗を確認できる。

f:id:kazumaxneo:20180720205148p:plain

 

終わると結果の画面に自動で移行する。

f:id:kazumaxneo:20180720210216p:plain

 

 マルチプルアライメント後、そのまま他のオンラインサービスを利用できる。

f:id:kazumaxneo:20180720211124p:plain

  • View (pubmed): MSAViewer(webと親和性の高いMSAビューア)によるマルチプルアライメント結果の確認。

f:id:kazumaxneo:20180720211048p:plain

  • Reformat:  to GCG, PHYLIP, MSF, NEXUS, uppercase/lowercase, etc. with Readseq
  • GUIDANCE2pubmed): computes the residue-wise confidence scores and extracts well-aligned residues.
  • Refine :機能不明
  • Phylogenic tree: 系統樹を作成する。

パラメータを選択する。defaultの設定で進む。

f:id:kazumaxneo:20180720211318p:plain

分子系統樹が描かれる。

f:id:kazumaxneo:20180720205514p:plain

 

他にも複数のMSAをマージしたり追加する機能があります。詳細は下の画像のリンク先からどうぞ。

merge

f:id:kazumaxneo:20180720212620p:plain

 

こちらのMABというオンラインサービスではマルチプルアライメントにMUSCLEが使われています。本サービスと同様、最後に分子系統樹が出力されます。

f:id:kazumaxneo:20180720205652p:plain

 

他に有名なものだとEMBL-EBIのサービスがあります。

f:id:kazumaxneo:20180720212058p:plain

 

MAFFTをターミナルで使う場合は以前の記事を参考にしてください。

 

引用

MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization

Katoh K, Rozewicki J, Yamada KD.

Brief Bioinform. 2017 Sep 6.


MSAViewer: interactive JavaScript visualization of multiple sequence alignments

Yachdav G, Wilzbach S, Rauscher B, Sheridan R, Sillitoe I, Procter J, Lewis SE, Rost B, Goldberg T

Bioinformatics. 2016 Nov 15;32(22):3501-3503. Epub 2016 Jul 13.

 

GUIDANCE2: accurate detection of unreliable alignment regions accounting for the uncertainty of multiple parameters
Itamar Sela, Haim Ashkenazy, Kazutaka Katoh, and Tal Pupko

Nucleic Acids Res. 2015 Jul 1; 43(Web Server issue): W7–W14.