細菌単離株の進化の背景を理解することは、幅広い研究への応用が期待される。しかし、正確な種の系統樹を作成することは依然として困難である。現在、種の同定には16S rDNAへの依存が一般的になっている。残念ながら、この普及している方法では、配列の保存性が高いために、種レベルでの分解能が低いという問題がある。現在では、最新の系統分類法や複数の遺伝的座位を用いて、より正確な種の同定に利用できる豊富なゲノムデータが存在している。しかし、これらは多くの場合、広範な専門知識と時間を必要とする。そこで、Automated Multi-Locus Species Tree (autoMLST) は、このワークフローを簡素化するための迅速な「ワンクリック」パイプラインを提供するために開発された: https://automlst.ziemertlab.com。このサーバーは、高解像度の種のツリーを生成するためにMulti-Locus Sequence Analysis(MLSA)を利用しているが、関連する分類法であるmulti-locus sequence typing (MLST)を事前に行うわけではない。結果として得られる系統樹には、 natural productの探索を支援するための種群指定や二次代謝物数などの有用なアノテーションも含まれている。現在利用可能なウェブインターフェースとは異なり、autoMLSTは、リファレンスゲノムの選択を自動化し、1つ以上のクエリゲノムに基づいて生物をアウトグループ化することができる。これにより、幅広い研究者が、手動の MLSA ワークフローと比較して、より迅速に厳密な系統解析を行うことができる。
https://automlst.ziemertlab.com
Denovo Mode - 関連する配列を自動的に検索し、デノボでアラインメントと種の系統樹を構築する
genomeのfastaをアップロードするか、NCBI accession numberを指定する(最大20ゲノム)。
分析項目を設定後、サブミットする。
解析中に自動で似たゲノムが検出される。
E.coliゲノム1つを使用した時の出力
ANIで色わけできる。
95%cutoffならANIが95%以上の株は同じ色になる。
Display strain info
queryとoutgroupが色付けされる。
antiSMASH v4からの Biosynthetic Gene Clusterの分布も色で示すことができる。
Bacteriocin Clusterの分布
系統樹ファイル、マルチプルアラインメントのファイル、似たゲノムの探索に使われたMash distanceのファイルをダウンロードできる。
Placement Mode - 配列を自動的にリファレンス遺伝子ツリーに追加し、合体した種の系統樹を計算する(高速)
入力手順はデノボモードと同じになる。
引用
AutoMLST: an automated web server for generating multi-locus species trees highlighting natural product potential
Mohammad Alanjary, Katharina Steinke, Nadine Ziemert
Nucleic Acids Research, Volume 47, Issue W1, 02 July 2019, Pages W276–W282
関連