macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

タイプ株を中心にバクテリアの表現型情報をまとめたデータベース BacDive

2020 10/16  タイトル変更、誤字修正

2021 10/7 画像一部更新

 

 原核生物は、研究開発との関連性が高い多種多様な表現型形質を発現する。バクテリアメタデータホットスポットとしてよく利用できるのは、最初の(一次)文献で報告された種の説明と、生物資源センター(BRC)によって管理されているデータベースである(ref.1)。それでも、両方の情報源にアクセスすることは困難であり、そして特定の表現型データの検索はしばしば面倒である。全ゲノム配列の数が急速に増えており(2018年7月5日現在までに、10 957ゲノムがNCBIゲノムデータベースに登録されている)、細菌表現型の予測および分析にますます使用されている。 Microbial trait analyzer(ref.2)のようなツールは、ゲノム配列から表現型の属性を自動的に予測し、シーケンシングされた生物の潜在的な表現型についての迅速な概観を可能にする。それにもかかわらず、これらのアプローチは、モデル生物の機能的配列情報に対する相同性の枠組みに依存しており、それはしばしば調査対象の生物とは遠く離れている。したがって、実験室の表現型データによる結果の検証は不可欠になる。さらに、包括的でよく構造化された表現型データを使用してアルゴリズムの精度を向上させ、それによって微生物の生物多様性に対するより良い予測と新しい洞察を可能にすることができる。

 BacDive - the Bacterial Diversity Metadatabase(https://bacdive.dsmz.de)は、広範囲のバクテリアおよび古細菌株にわたってメタデータを集め構造化し、メタデータを提供している。主な情報源は、BRCの内部データベース(例:DSMZ、CIP)、未発表の研究者のコレクション(例:Reichenbach collection of Myxobacteria、Wink compendium of Actinobacteria (ref.3))および一次文献の種の記述(例:International Journal of Systematic and Evolutionary Microbiology)である 。これらの情報源にアクセスし、関連するデータを整理して組み合わせることで、BacDiveは分類学、形態学、生理学、培養、地理的起源、原核生物の応用および分子データに関する包括的なデータセットを提供する。全てのデータは株に関連しており、それぞれの参考文献にリンクされている。

 2012年4月の発表以来(ref.3)、BacDiveは実質的にさらに発展している。データフィールドの数が増え、検索機能が改善され、Restful Webサービスが実装された(ref.4)。最近の開発は、一次文献から手作業でアノテーション付けしたデータおよびBRCの内部ファイルおよび個人的なコレクションから動員したデータを用いた株データセットの修正に焦点を当てていた(ref.1)。データ内容およびデータフィールドの増加、ならびにそれに付随するグラフィカルユーザインターフェース(GUI)および検索機能への適応について、以下に説明する。

 現在のBacDiveリリース(2018年7月)は、2637属および13 569種に分布する63 669の菌株を対象としている。 BacDiveに含まれる12 715株は、その種のタイプ株を表す。 データベースはProkaryotic Nomenclature Up-to-Date (PNU)データベースにリストされている14 395の正当に公表されている型株の88%をカバーしている。 過去数年にわたり、既存の株データセットの充実は、新しい株に関する情報の収集よりも優先されていた。 したがって、2015年にBacDiveがカバーした株の総数(53 978)と比較すると、新しい株の増加は18%だが、1株あたりのデータ量はすべてのセクションで大幅に増加した(論文表1)。 セクションの形態と生理学(485%)、培養と成長条件(391%)、そして単離、サンプリングと環境情報(247%)は特に増加している。

新しい種類のデータ

 Analytical Profile Index(API)テスト、脂肪酸プロファイル、抗生物質感受性テストなどの表現型テストのデータを統合することで、新しいデータタイプがBacDiveに導入された。(一部略)

 The API® strip testは、微生物を迅速に識別するための十分に確立された生理学的試験システムである。製造業者bioMérieuxには22のテストストリップを提供しており、各テストストリップは最大50のシングルテストで構成されている。(一部略)現在、BacDiveは、5237細菌株のデータを含む8977API®テストデータを提供している。これは世界最大のAPI®テスト結果のコレクションであり、多様な細菌株に関する表現型情報を提供している。

 最近、脂肪酸プロファイルと抗生物質感受性のデータもBacDiveに統合された。どちらのデータタイプも分類法、したがってBacDiveの大規模なユーザーグループにとって非常に重要である。最初に、395の脂肪酸プロファイルおよび475の抗生物質感受性試験の結果が集められた。このコレクションは継続的に修正されている。

文献データ

 最も包括的だが同時にメタデータのための最も多様な情報源は一次文献である。メタデータはさまざまなジャーナルに散在している。標準化と一意の識別子がなく、文学からの動員は困難である。細菌および古細菌メタデータについては、the International Journal of Systematic and Evolutionary Microbiology (IJSEM) が特に重要であり、最大80%の新種の説明がこのジャーナルに掲載されている。 IJSEMの種の記述は表現型メタデータに富んでいるだけでなく、かなり保存された構造も持っている。これにより、ジャーナルはメタデータ注釈の主要な情報源になる。 IJSEMの種の記述に基づいて、最大152の異なるデータフィールドに手動でデータをアノテーションするシステムを設定した。これらのデータは、コントロールされた語彙と割り当てられたグローバル識別子を使用して変換された。最初に、523種類の株に関するデータが収集された(ref.1)。それ以来、本著者らはすべての新しく発表された種の説明からのデータに継続的にアノテーションをつけることによって進めた。これまでのところ、1387株のデータには手動でアノテーションが付けられていた。 2017年に、Barberán et al.,(ref.5)は5129株および最大30のデータフィールドについてのIJSEMからのアノテーション付きデータを含むデータセットを発表した。慎重な調整後、この供給源からの4081株のデータがBacDiveに組み込まれた。現在のリリースでは、BacDiveは合計5468株についてのIJSEMの種の説明からのアノテーション付きデータを提供している(https://bacdive.dsmz.de/advsearch?site=advsearch&searchparams%5B84%5D%5Bsearchterm%5D=IJSEM&advsearch=sea

(以下略) 

 

チュートリアル

https://bacdive.dsmz.de/tutorials

BacDive Quickstart tutorial (音が鳴ります)

 

他にもいくつか動画が準備されています。

https://bacdive.dsmz.de/tutorials

 

wiki

https://en.wikipedia.org/wiki/BacDive

 


使い方

https://bacdive.dsmz.de/ にアクセスする。 

f:id:kazumaxneo:20211007223715p:plain

(画像更新)

 

タイプ株を中心に様々な細菌の情報がまとめられている。

f:id:kazumaxneo:20211007224150p:plain

(グラフの要素をクリックするとその情報ソースにジャンプする)

 

その場で素早く検索できる。f:id:kazumaxneo:20190705230031p:plain

 

 

Acinetobacter baylyi A7のページを開いた。

f:id:kazumaxneo:20190705230130p:plain

 

strain A7はプロテオバクテリア門のガンマプロテオバクテリア綱、アシネトバクター属のAcinetobacter baylyiという菌であることが分かる。すべての情報には左端に引用元文献のリンクがついている。

f:id:kazumaxneo:20190705230354p:plain

 

資化できる炭素/窒素源、耐性など様々なテスト(API®テスト)の結果がまとめられている。

f:id:kazumaxneo:20190705230929p:plain

API®テストについて

f:id:kazumaxneo:20190705231102p:plain

 

培養条件もまとめられる。

f:id:kazumaxneo:20190705231405p:plain

 

単離場所

f:id:kazumaxneo:20190705231424p:plain

 

ページ下には引用文献のリンクがついている。中にはもしかして間違っていたり、結果が揺れ動くようなメタ情報(+/-)もあるかもしれない。そのような時に引用文献のリンクがあるととても役に立つ。

 

他の機能について

API® test finder

メニューからAPI® test finderを選択

f:id:kazumaxneo:20190705231819p:plain

 

各テスト項目の結果から菌を絞り込める。

f:id:kazumaxneo:20190705231950p:plain

空白部分をクリックして+か-か選んでいく。

 

テスト内容が不明な場合、テストの文字部分をクリックすることで解説ページにジャンプできる。

f:id:kazumaxneo:20190705232218p:plain

 

TAXplorer

taxonomyの枠組みに従ってバクテリアアーキアを検索できる。

f:id:kazumaxneo:20190705235254p:plain

 

Advanced search

詳細な条件を指定した検索

f:id:kazumaxneo:20190705235533p:plain

 

Isolation sources

f:id:kazumaxneo:20190705235614p:plain

 

左上のFilterボタンをクリックすると、菌を単離した環境から絞り込める。

f:id:kazumaxneo:20190705235937p:plain

 

Enviromental => Aquatic => Freshwaterを選択して、Submit Filterボタンをクリック。

f:id:kazumaxneo:20190706001220p:plain

該当する菌が表示されている。

 

テーブル上のde-/select all displayed strainsボタンをクリックして、該当する菌の行を全選択した。

f:id:kazumaxneo:20190706001406p:plain

 

この状態でテーブル上のadd selectionをクリックすれば、該当する菌のメタデータを含むCSVをダウンロードできる。

f:id:kazumaxneo:20190706001634p:plain

exportボタンをクリックすればCSV形式でダウンロードされる。

 

Mapをクリックすると国ごとの単離された菌体数を視覚化できる。

f:id:kazumaxneo:20190706000505p:plain

単離された菌体数は色の濃さで表される。

 

単離環境の内訳はkronaで視覚化されている(右上のopen chartをクリック)。

f:id:kazumaxneo:20190706000843p:plain

 

菌のwikiでもよく引用ソースになっています。情報の精度が高いため、メタゲノムやコンタネーションの分析にも利用できると思います。

引用

BacDive in 2019: bacterial phenotypic data for High-throughput biodiversity analysis
Lorenz Christian Reimer Anna Vetcininova Joaquim Sardà Carbasse Carola Söhngen Dorothea Gleim Christian Ebeling Jörg Overmann
Nucleic Acids Research, Volume 47, Issue D1, 08 January 2019, Pages D631–D636

 
BacDive--The Bacterial Diversity Metadatabase in 2016
Söhngen C, Podstawka A, Bunk B, Gleim D, Vetcininova A, Reimer LC, Ebeling C, Pendarovski C, Overmann J

Nucleic Acids Res. 2016 Jan 4;44(D1):D581-5


BacDive--the Bacterial Diversity Metadatabase
Söhngen C, Bunk B, Podstawka A, Gleim D, Overmann J

Nucleic Acids Res. 2014 Jan;42(Database issue):D592-9

 

関連