macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

検索可能な惑星規模の微生物叢リソース SPIRE

 

 メタオミクスデータは、微生物の多様性と機能に関する情報が公共のレポジトリで指数関数的に蓄積されているが、派生した情報はデータの種類、研究、または採集された微生物環境に応じて孤立した状態で管理されている。ここでは、生息地、地理、系統関係を超えて一貫した処理が施されたメタゲノム由来の微生物データモダリティを統合する「SPIRE(Searchable Planetary-scale mIcrobiome REsource)」を紹介する。SPIREは、739の研究から得られた99,146のメタゲノムサンプルを収録し、多様な微生物環境をカバーするとともに、手動でキュレーションされた文脈データで補完されている。総メタゲノムアセンブリ容量16Tbpにおいて、SPIREは350億の予測タンパク質配列と、中程度から高程度の品質を有する116万のメタゲノムアセンブリゲノム(MAGs)を包含している。proGenomes3(http://progenomes.embl.de)が提供する高品質ゲノムリファレンスへのマッピングを超えて、これらの新規MAGは92,134の種レベルクラスターを形成し、そのうち大多数は現在のツールでは種レベルで分類されていないものである。SPIREは、更新されたカスタムmOTUsデータベース(https://motu-tool.org/)を通じてこれらの種クラスターの分類学的プロファイリングを可能にし、複数の機能注釈層を含むほか、複数の(マイクロ)生物学データベースとのクロスリンクを提供している。このリソースは、http://spire.embl.de 経由でアクセス可能、検索可能、閲覧できる。

 

FAQ

http://spire.embl.de/faqs

spire_contribute (リクエストも可能かもしれない)

 

webサービス

http://spire.embl.de/にアクセスする。

 

Explore Environmentsでは、プロジェクトからOTUを閲覧できる。

 

MetaSUBの結果を閲覧する。4116サンプル含まれている。

 

含まれるメタゲノムアセンブリ数、protein数などが示されている。右のリンクからダウンロードできる(全サンプルの全メタゲノムアセンブリ)。

 

各サンプル個別のアセンブリは、下の表からダウンロードできる(binningされていない生のメタゲノムアセンブリ)。

 

表のサンプル名をクリックすると詳細を閲覧できる。また、eggNOG mapperのアノテーション結果やMitochondria、真核生物、細菌、アーキアそれぞれのrRNA配列をダウンロードできる。また、deepARGやabricateでアノテーションされた抗生物質耐性遺伝子のアノテーション、CRISPR配列、contigデプスもダウンロード可能。

 

 

TopページのTaxonomyでは、分類名から収録されているデータを閲覧できる。アーキアバクテリア、Otherに分かれている。

1つ見てみる。

Cyanobacteria - 1137リスト(2025年8月時点)

SPIRE Genomesのリストとして表示される。1つ1つの行がSPIRE に収録されているゲノムとなる。表には、SPIRE  ID、sampleID、N50, checkMの完全性と汚染度、ORF数、GUNCスコアなどが示されている。右端からはゲノムをダウンロードできる。sampleIDは、上のExplore genomeと同じsampleページにリンクしている。

表のゲノムを1つ見てみてみる。表と同じ要約統計量が示されている。上のリンクから、種やもっと大分類にリンクしている。

GTDBへもリンクしている。

 

大分類やsampleクラスターのページでは、統計量がグラフに示される。

 

生息地も表示される。

 

Progenomesにリンクしている。Progenomesでさらに分析することもできる。

 

引用
SPIRE: a Searchable, Planetary-scale mIcrobiome REsource

Thomas S B Schmidt, Anthony Fullam, Pamela Ferretti, Askarbek Orakov, Oleksandr M Maistrenko, Hans-Joachim Ruscheweyh, Ivica Letunic, Yiqian Duan, Thea Van Rossum, Shinichi Sunagawa, Daniel R Mende, Robert D Finn, Michael Kuhn, Luis Pedro Coelho, Peer Bork

Nucleic Acids Res. 2024 Jan 5;52(D1):D777-D783.

 

関連