環境DNAシーケンシングは、微生物の多様性と生態系に関する我々の理解に革命をもたらした。現在では、地下深部から山の頂上まで、無数の宿主、生物群、条件を網羅する地球全体のマイクロバイオームの塩基配列が決定されている。しかし、シークエンシングや処理戦略の多様性が普遍的な洞察を妨げている。
MicrobeAtlasは、200万を超えるマイクロバイオームサンプルを単一のリソースに統合し、技術の垣根を越えた発見を促進するために調和されている。コミュニティは調整可能なSSU rRNAマーカー遺伝子の分解能で階層的に定量化され、豊富な地理情報を含む詳細なメタデータを備えている。ゲノム、表現型、および生態学的リソースとの接続により、マルチモーダルな洞察が可能になる。
微生物系統は、希少な未特性種の「ロングテール」を含め、環境全体にわたって確実に追跡できる。繰り返される群集構造や地理的嗜好が明らかになり、世界的な分類群特異的な一般性の傾向が現れる。MicrobeAtlas (www.microbeatlas.org)を使えば、既知の種も新たに記載された種や群集も、以前の研究を最大限に活用しながら、容易に生態学的文脈に位置づけることができる。
https://microbeatlas.org/landingにアクセスする。
(2025年8月現在はβ版となっている)
種名で絞り込める。高次分類でも検索可能。

タイプ株が深海2600mの熱水噴出孔のポンペイワームチューブの背側表皮から分離培養されているVibrio diabolicusを使って検索した(この種は、その後、様々な海洋環境と貝類から単離されている)。
検索結果

MAPごとに整理されて表示されている。一番上のMAPv3;90_1849を見てみる。

MAPv3;90_1849には369 samples含まれると書かれている。
MAPタブに切り替えた。プロットの大きさはppm単位での存在量を表している。海にいる菌なので、USと中国の沿岸海域や外洋の海域でプロットが見つかり、内陸にはほとんどプロットがない。拡大しないと分からないが、内陸部分も陸域ではなく河川である可能性がある。

sampleタブ。krona形式のplotで、サンプル間で分布が多い環境が示される。この菌は水生環境(aquatic: 水色)に多いが、動物(red: 赤色)からも見つかっている。灰色はunknown。

右側には数値表記がある。
Readsタブ: OTUにマッピングされるリードの割合で環境ごとの分布が示されている。

Prevalence : この分類群のPrevalenceと平均アバンダンス、各環境ごとに10の独立した区間として示される(注; V. diabolicusが人に病気を起こすという報告はない)

log10スケールでのアバンダンス。水生環境に多いことが分かる。

Samples

存在量が多いサンプルを調べることができる。

SRAのIDでも検索できる。

検索結果

1つ見てみる。


菌叢の内訳が示される。Vibrioも含むGammaproteobacteriaが96.70%:3210リードとほとんどの割合を占めている。

(注: こちらのplotはkronaのように階層間をインタラクティブに移動することには対応していない)
Projectsタブ
プロジェクト単位で絞り込みが可能。

Publicationsタブ
特定の出版物からの絞り込みが可能。

Projectsタブ
プロジェクトから絞り込むことが可能。

Sample Groupsタブ
主要環境とサブ環境ごとにクラスター化されたグループで絞り込むことが可能。

MAPseqタブ
ユーザーのrRNA配列で一致するOTUを見つけることができる。1つまたは複数の配列をペーストする。

配列をペーストしてサブミットする。

出力例

注;配列による検索はTOPページからも行える。

下にあるイラストは有名な菌のダイレクト検索リンクとなっている。大腸菌などが書いてある。
環境(生息地)でも検索できる。plastisphereで検索、

その他(論文より)
- 既存の大規模データセットのほとんどは特定の環境や宿主に限られており、これらのコレクションを体系的に関連付ける方法が不足している。現在までに実施された最大の環境横断的研究である「Earth Microbiome Project」は、27,000件を超える微生物群集サンプルを分析しているが、これでもpublicに公開されているデータセットのほんの一部に過ぎず、他の研究との統合も進んでいなかった。
引用
The MicrobeAtlas database: Global trends and insights into Earth’s microbial ecosystems
João Frederico Matias Rodrigues, Janko Tackmann, Lukas Malfertheiner, David Patsch, Eugenio Perez-Molphe-Montoya, Nicolas Näpflin, Daniela Gaio, Gregor Rot, Mihai Danaila, Matteo Eustachio Peluso, Marija Dmitrijeva, Thomas Sebastian Benedikt Schmidt
bioRxiv, Posted July 18, 2025.
MAPseq: highly efficient k-mer search with confidence estimates, for rRNA sequence analysis
João F Matias Rodrigues, Thomas S B Schmidt, Janko Tackmann, Christian von Mering
Bioinformatics. 2017 Dec 1;33(23):3808-3810
関連
