2019 11/8 pATLASflow紹介リンク追加
プラスミドは、mobile genetic elements(MGE)として分類されるchromosome外遺伝因子であり、細菌間で自己複製および転移する能力があるため、遺伝子の水平伝播において極めて重要な役割を果たしている(ref.1〜3)。プラスミドはサイズが大きく異なり、ほとんどが環状であり、さらに重要なことには、特定の条件下で宿主に選択的な利点を提供する遺伝子を運ぶことがよくある(ref.1〜3)。たとえば、プラスミドは抗生物質耐性の獲得と拡大の鍵となるMGEであり、毒性形質の伝達に重要な役割を果たす可能性がある(ref.1,4,5)。
特に、プラスミドは、挿入配列、トランスポゾン、インテグロン、および機能的に関連するカーゴ遺伝子を運ぶ可能性のある他のプラスミドを含む、他のMGEの統合または切除によってDNA断片を容易に失ったり獲得したりできるため、キメラおよびモジュラーであると考えられる。さらに、プラスミドは細菌のchromosomeに組み込まれることもあり、これによりさらなる拡散方法が保証される(ref.1–3)。この高い遺伝的可塑性は、プラスミドの知識が細菌群集のダイナミクスを理解する上で最も重要であることを明確に示している(ref.1–5)。ただし、ハイスループットシーケンス(HTS)データでのプラスミドの検出は簡単ではなく、ショートリードテクノロジーやメタゲノム研究で使用する場合は特に困難である(ref.6)。
現在、特定のマーカーを検索するか、プラスミド配列が異なると仮定するか、何らかの特徴(例えば、プラスミドの環状性により、プラスミドのコピー数が多いか、プラスミドに由来するコンティグを環状化できることを考えると、プラスミドリードはchromosomeリードよりも高いシーケンスカバー率を持つ傾向がある)を使いcBar(ref.7)、PLACNET(ref.8)、plasmidSpades(ref.9)、Recycler(ref.10)など、HTSデータからプラスミドをアセンブルまたは抽出するための多くのツールが利用できる。ただし、プラスミドは細胞内に単一コピーで存在する可能性があり(ref.5)、線形DNA分子である可能性もあるため(ref.1–3)、これらの仮定が常に満たされるとは限らない。 PlasmidFinder(ref.11)やMOB-suite(ref.12)などの他のツールを使用すると、それぞれincompatibility (Inc) groupsまたはレプリコン(Rep)または relaxase (MOB; (4))遺伝子を使用してプラスミドを識別できる。別の方法論、 PlasmidProfiler は、PlasmidFinderデータベースに対してリードマッピングとBLAST +(ref.13)検索の組み合わせを使用してプラスミドタイプを検索し、異なるプラスミドの存在を予測するが、それらのcargoに関する情報を提供していない。 HTSデータでプラスミドを再構築または検索する方法に関係なく、ユーザーはヒットリストを解釈し、これらの可能性のあるプラスミドが宿主細菌に与える影響を評価するのに苦労する。
現在、NCBIのRefSeqプラスミドデータベースには13 924のエントリがあり(ref.14)、この一連のプラスミド配列を閲覧するためのツールが不足している。ここでは、NCBIのRefSeqデータベースにある既存のプラスミドを探索し、HTSデータからプラスミドを特定できるように、ユーザーが簡単にアクセスできる視覚分析ツールを提供する目的で、Plasmid Atlas(pATLAS)について説明する。 pATLASは、CBI(ref.15)、ResFinder(ref.16)、 Virulence factors database (VFDB) (ref.17)およびPlasmidFinder(ref.11)データベースに基づくde novoアノテーションにより、NCBIのRefSeqデータベースで利用可能なすべてのプラスミドに関連するメタデータ、およびその推定抗生物質耐性および病原性遺伝子、およびプラスミドファミリーの可視化と探索を可能にする。 REpresentational State Transfer application programming interface (REST API)を提供することにより、pATLASをプラスミドの識別を目的とするパイプラインに簡単に統合して、提供するデータベースと視覚化ツールを活用できる。
Documentation
https://patlas.gitbook.io/docs/
local版
https://patlas.gitbook.io/docs/api/local_installation
pATLASflowを使うと、mashを走らせ、生成されるJSONファイルをwebサービスに読み込ませることができる。
詳細
pATLASflowの紹介
使い方
http://www.patlas.site にアクセスする。
各ノード(頂点)はプラスミドを表し、各リンク(エッジ)は、mashと論文にて定義された基準で作成されたマトリックスからの2つのプラスミド間の関係を表している。
左上のバーをクリックしてメニューを出す。
ここではtaxonomyから絞り込んでみる。Browse => Taxaを選択。
ここではアシネトバクター属の菌に絞り込む。複数選択できるが、その場合はANDではなくOR扱いとなる。
Highlightをクリックする。
ここではFilter and keep~を選ぶ。
再レンダリングされた。
さらに絞り込む。Browse => lengthからサイズ選択。
再レンダリングされた。左上と右下にたくさんのノードが残っている。
ノードをクリックするとplasmidの詳細な情報が表示される。表示されるのは、accesion IDやサイズに加え、抗菌剤と金属耐性のデータベースBacMet、virulance factorのデータベースVFDB、ABRicate(紹介)、PlasmidFinderからのメタデータになる。プラスミドの特徴を素早く掴むことができる。
右下のクラスタのプラスミドはいくつか耐性遺伝子が見つかった。
上のメニューの右から3つ目のボタンよりプラスミドのメタデータテーブルを生成できる(メニュー詳細)。
テーブルが生成された。
一度初期状態に戻る。上のhomeボタンをクリックする。
Browse => Taxaから別のgenusを選択、さらに下にあるresistanceをクリック。
AACを全て 選択した。
再レンダリングされた。今度は数が多い。
下の再生ボタンを押すと、強制的に指示されたレイアウトで計算が再開され、各ノードが動いて各クラスタがより遠くに分離される。たとえば現在の選択をフィルタリングした後、プラスミドを互いに分離したい場合、グラフをさらにレンダリングするために使用する。
今度は左のメニューからStatisticsを開く。
Statistics => Species。選抜されたプラスミドについて、ホストの菌のspecies情報がまとめられる。
Statistics => Vilulance
引用
Plasmid ATLAS: plasmid visual analytics and identification in high-throughput sequencing data
Tiago F Jesus, Bruno Ribeiro-Gonçalves, Diogo N Silva, Valeria Bortolaia, Mário Ramirez, João A Carriço
Nucleic Acids Research, Volume 47, Issue D1, 08 January 2019, Pages D188–D194
関連