プラスミドには、病原因子や抗生物質耐性機構をコードする遺伝子が含まれていることが知られている。メタゲノミクスデータ処理におけるその関連性は着実に高まっている。しかし、メタゲノム実験の普及と規模の拡大に伴い、報告されるプラスミドの数も急速に増加しており、未検出のミスアセンブリによる偽陽性が相当数蓄積されている。この以前に出版したPLSDBデータベースにより、研究者は自分の配列を選択され注釈が付けられた過去の知見と素早く比較するための信頼できるリソースとして利用できる。このデータベースは、8回の定期的なデータ更新により、当初の13,789件から2倍以上の34,513件に増加した。今回の更新では、新しい分析機能、パフォーマンス、品質、アクセシビリティの改善など、データベースの大幅な変更について、コミュニティからのフィードバックを集約している。新しいフィルタリングステップ、アノテーション、既存レコードの前処理により、提供されるデータの品質が向上している。さらに、ウェブサーバーに実装された新機能は、ユーザーとの対話を容易にし、類似性情報を視覚化することで、カスタムアップロードされた配列の理解を深めることができる。最後に、自動化されたワークフローでリモートデータベースクエリーを可能にするために、アプリケーションプログラミングインターフェースとPythonライブラリが実装された。PLSDBの最新リリースは、https://www.ccb.uni-saarland.de/plsdb の下で自由にアクセスできる。
FAQ
https://ccb-microbe.cs.uni-saarland.de/plsdb/faq/
https://ccb-microbe.cs.uni-saarland.de/plsdb/にアクセスする。
メニューのPlasmidsから登録されているプラスミドを閲覧できる。
クリックすると詳細が表示される。1つ見てみる。
単離源、タイプ、ホスト、Biosample(NCBIにリンク)、配列(NCBI GenBankにリンク)、アサインされている分類(NCBI taxにリンク)、lineage(NCBI taxのlineageにリンク)などが確認できる。
画面下には追加のアノテーション、pMLST(Plasmid MLST)のlocusもあるなら表示される。
Searchではデータベースと自分の配列を比較できる。自分のプラスミド配列をアップロードし、Mash screenを使って類似した配列を探す。Mash screenではファイルサイズの上限が500MBまで対応しているので、メタゲノムアセンブリからも探索できるかもしれない(未テスト)。
BLASTnなどに変更することもできる。
出力例(Mash screenのexample data使用)
ヒットしたプラスミドのBiosampleの地理的位置、ヒットしたプラスミドが含まれる分類群のkrona様プロット、環状と線状のトポロジーの棒グラフ、長さとGC分布、なども表示される。
Downloadからはデータベースに保存されているすべてのプラスミド配列をダウンロードできる(Download FASTA archiveボタン)。ファイルサイズは2023年3月現在3.6GB。
METAアーカイブには、本データベースに格納されているすべてのプラスミドのメタ情報、追加注釈、Mashスケッチ、塩基配列から作成したBLASTデータベースファイルなどが含まれている(Download META archiveボタン)。
引用
PLSDB: advancing a comprehensive database of bacterial plasmids
Georges P Schmartz, Anna Hartung, Pascal Hirsch, Fabian Kern, Tobias Fehlmann, Rolf Müller, Andreas Keller
Nucleic Acids Research, Volume 50, Issue D1, 7 January 2022, Pages D273–D278
関連