macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

プラスミドの分析と視覚化のwebサービス Plasmid ATLAS

2019 11/8  pATLASflow紹介リンク追加

 

 プラスミドは、mobile genetic elements(MGE)として分類されるchromosome外遺伝因子であり、細菌間で自己複製および転移する能力があるため、遺伝子の水平伝播において極めて重要な役割を果たしている(ref.1〜3)。プラスミドはサイズが大きく異なり、ほとんどが環状であり、さらに重要なことには、特定の条件下で宿主に選択的な利点を提供する遺伝子を運ぶことがよくある(ref.1〜3)。たとえば、プラスミドは抗生物質耐性の獲得と拡大の鍵となるMGEであり、毒性形質の伝達に重要な役割を果たす可能性がある(ref.1,4,5)。

 特に、プラスミドは、挿入配列、トランスポゾン、インテグロン、および機能的に関連するカーゴ遺伝子を運ぶ可能性のある他のプラスミドを含む、他のMGEの統合または切除によってDNA断片を容易に失ったり獲得したりできるため、キメラおよびモジュラーであると考えられる。さらに、プラスミドは細菌のchromosomeに組み込まれることもあり、これによりさらなる拡散方法が保証される(ref.1–3)。この高い遺伝的可塑性は、プラスミドの知識が細菌群集のダイナミクスを理解する上で最も重要であることを明確に示している(ref.1–5)。ただし、ハイスループットシーケンス(HTS)データでのプラスミドの検出は簡単ではなく、ショートリードテクノロジーやメタゲノム研究で使用する場合は特に困難である(ref.6)。

 現在、特定のマーカーを検索するか、プラスミド配列が異なると仮定するか、何らかの特徴(例えば、プラスミドの環状性により、プラスミドのコピー数が多いか、プラスミドに由来するコンティグを環状化できることを考えると、プラスミドリードはchromosomeリードよりも高いシーケンスカバー率を持つ傾向がある)を使いcBar(ref.7)、PLACNET(ref.8)、plasmidSpades(ref.9)、Recycler(ref.10)など、HTSデータからプラスミドをアセンブルまたは抽出するための多くのツールが利用できる。ただし、プラスミドは細胞内に単一コピーで存在する可能性があり(ref.5)、線形DNA分子である可能性もあるため(ref.1–3)、これらの仮定が常に満たされるとは限らない。 PlasmidFinder(ref.11)やMOB-suite(ref.12)などの他のツールを使用すると、それぞれincompatibility (Inc) groupsまたはレプリコン(Rep)または relaxase (MOB; (4))遺伝子を使用してプラスミドを識別できる。別の方法論、 PlasmidProfiler は、PlasmidFinderデータベースに対してリードマッピングとBLAST +(ref.13)検索の組み合わせを使用してプラスミドタイプを検索し、異なるプラスミドの存在を予測するが、それらのcargoに関する情報を提供していない。 HTSデータでプラスミドを再構築または検索する方法に関係なく、ユーザーはヒットリストを解釈し、これらの可能性のあるプラスミドが宿主細菌に与える影響を評価するのに苦労する。

 現在、NCBIのRefSeqプラスミドデータベースには13 924のエントリがあり(ref.14)、この一連のプラスミド配列を閲覧するためのツールが不足している。ここでは、NCBIのRefSeqデータベースにある既存のプラスミドを探索し、HTSデータからプラスミドを特定できるように、ユーザーが簡単にアクセスできる視覚分析ツールを提供する目的で、Plasmid Atlas(pATLAS)について説明する。 pATLASは、CBI(ref.15)、ResFinder(ref.16)、 Virulence factors database (VFDB) (ref.17)およびPlasmidFinder(ref.11)データベースに基づくde novoアノテーションにより、NCBIのRefSeqデータベースで利用可能なすべてのプラスミドに関連するメタデータ、およびその推定抗生物質耐性および病原性遺伝子、およびプラスミドファミリーの可視化と探索を可能にする。 REpresentational State Transfer application programming interface (REST API)を提供することにより、pATLASをプラスミドの識別を目的とするパイプラインに簡単に統合して、提供するデータベースと視覚化ツールを活用できる。

 

Documentation

https://patlas.gitbook.io/docs/

 

local版

https://patlas.gitbook.io/docs/api/local_installation


 

pATLASflowを使うと、mashを走らせ、生成されるJSONファイルをwebサービスに読み込ませることができる。

詳細

 

pATLASflowの紹介



 

使い方

http://www.patlas.site にアクセスする。

f:id:kazumaxneo:20191104205131p:plain

各ノード(頂点)はプラスミドを表し、各リンク(エッジ)は、mashと論文にて定義された基準で作成されたマトリックスからの2つのプラスミド間の関係を表している。

 

左上のバーをクリックしてメニューを出す。

f:id:kazumaxneo:20191105003147p:plain

 

ここではtaxonomyから絞り込んでみる。Browse => Taxaを選択。

f:id:kazumaxneo:20191105012900p:plain

 

ここではアシネトバクター属の菌に絞り込む。複数選択できるが、その場合はANDではなくOR扱いとなる。

f:id:kazumaxneo:20191105013438p:plain

Highlightをクリックする。

ここではFilter and keep~を選ぶ。

f:id:kazumaxneo:20191105013631p:plain

レンダリングされた。

f:id:kazumaxneo:20191105013830p:plain

 

さらに絞り込む。Browse => lengthからサイズ選択。

f:id:kazumaxneo:20191105020051p:plain

 

レンダリングされた。左上と右下にたくさんのノードが残っている。

f:id:kazumaxneo:20191105020027p:plain

 

ノードをクリックするとplasmidの詳細な情報が表示される。表示されるのは、accesion IDやサイズに加え、抗菌剤と金属耐性のデータベースBacMet、virulance factorのデータベースVFDB、ABRicate(紹介)、PlasmidFinderからのメタデータになる。プラスミドの特徴を素早く掴むことができる。

f:id:kazumaxneo:20191105014245p:plain

 

右下のクラスタのプラスミドはいくつか耐性遺伝子が見つかった。

f:id:kazumaxneo:20191105020440p:plain

上のメニューの右から3つ目のボタンよりプラスミドのメタデータテーブルを生成できる(メニュー詳細)。

f:id:kazumaxneo:20191105024356p:plain

テーブルが生成された。

f:id:kazumaxneo:20191105024215p:plain

 

 

一度初期状態に戻る。上のhomeボタンをクリックする。

f:id:kazumaxneo:20191105021937p:plain

 

Browse => Taxaから別のgenusを選択、さらに下にあるresistanceをクリック。

f:id:kazumaxneo:20191105022037p:plain

 

AACを全て 選択した。

f:id:kazumaxneo:20191105022519p:plain

 

レンダリングされた。今度は数が多い。

f:id:kazumaxneo:20191105022626p:plain

下の再生ボタンを押すと、強制的に指示されたレイアウトで計算が再開され、各ノードが動いて各クラスタがより遠くに分離される。たとえば現在の選択をフィルタリングした後、プラスミドを互いに分離したい場合、グラフをさらにレンダリングするために使用する。

 

今度は左のメニューからStatisticsを開く。

f:id:kazumaxneo:20191105022758p:plain

Statistics => Species。選抜されたプラスミドについて、ホストの菌のspecies情報がまとめられる。

f:id:kazumaxneo:20191105022715p:plain


Statistics => Vilulance

f:id:kazumaxneo:20191105023130p:plain

 

引用

Plasmid ATLAS: plasmid visual analytics and identification in high-throughput sequencing data
Tiago F Jesus, Bruno Ribeiro-Gonçalves, Diogo N Silva, Valeria Bortolaia, Mário Ramirez, João A Carriço
Nucleic Acids Research, Volume 47, Issue D1, 08 January 2019, Pages D188–D194

 

関連