macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

世界中の微生物種の生態を調べる Microbe Atlas Project(MAP)データベース

 

https://microbeatlas.org/index.html?action=aboutより

 メタゲノム配列が決定された大規模なサンプル群を集約的に解析することで、未知あるいは研究が不十分な微生物分類群が存在する典型的な存在量や環境に関する情報を蓄積できる。これにより、未知の微生物分類群がどのような環境に多く存在するのかについての第一線の情報が得られ、その能力の推論が可能になる。この情報により、微生物研究者は、試料中の微生物分類群のうち、自分の研究関心に関連しそうなものに優先順位をつけることができるようになる。
 微生物群集は、同じ環境から採取されたサンプルであっても、多様で大きく変動することが多いため、環境における有意差や変化を特徴付けるためには、参照ゲノムセットの利用が不可欠となる。MAPのウェブサイトでは、研究者が自身のマイクロバイオームサンプルを100万以上のMAPリファレンスマイクロバイオームと比較することができる。これらは、著者らが以前に解析したメタゲノム配列のサンプルで、NCBI SRAデータベースから取得したものである。このような違いは、研究対象サンプルに特有の興味深い生物学的効果によるものか、あるいはプロトコルの違いによるものかもしれませんが、結果を解釈する際には考慮されるべきものである。

MAPについて
世界の微生物多様性がいかに未知であるかは、完全に配列決定されたゲノムや培養収集株が利用可能な微生物種のごく一部(2%)によく表れている。大多数の微生物種は、メタゲノム試料中の16Sまたは18SリボソームRNA遺伝子(SSU rRNA)の配列決定からしか存在を知られていない。
The Microbe Atlas Projectは、配列決定された大量の微生物群集を活用することで、これらの捉えどころのない微生物の生態に新たな光を当てることを目的としている。個々の微生物群集や単一の研究の解析結果を提供するだけでなく、すべての微生物群集や研究の解析結果を組み合わせて、微生物の生態を包括的に把握することができるのが、本アプローチの特徴である。このリソースは、いくつかの手法、ツール、パイプライン(HPC-CLUST、MAPseq)の締結により実現された。
配列決定された微生物群集に関する微生物量の定量化は、MAPseq(引用1)を用いたクローズド・リファレンス・リボソームRNA解析に基づいて行われる。共通のリファレンスを使用することで、異なるシーケンスプロトコルを使用するサンプルおよび研究間で、微生物分類群の存在量を直接比較することができる。したがって、解析されたシーケンスデータには、アンプリコンシーケンス、ショットガンシークエンス、メタトランススクリプトームシーケンスが含まれる。

Documentation(ワークフローが説明されています)

https://microbeatlas.org/index.html?action=help

 

webサービス

https://microbeatlas.org/にアクセスする。

種名や配列などで検索できる。Nostoc punctiformeで検索してみる。

 

Nostoc punctiformeがトップヒットした。興味があるtaxaをクリックする。

 

どのような環境サンプルに含まれているか集計された結果が表示される。

シークエンスされたサンプルでは土壌に多いことが分かった。

 

MAPをクリックするとサンプリングされた場所がどこかを定量的に確認できる。

 

ソースごとに色分けすることもできる。

ソース

Readsのkronaスタイルの視覚化。

Projectsタブでは収録されているSRAのIDから探索できる。

 

Publication explorerタブでは論文を検索できる。

 

MAPseqタブでは、rRNA配列をペーストすることで素早く階層的な分類情報を調べることができる。

 

出力例

 

 

  • 微生物群集の性質は多様であるため、典型的な微生物群集の特徴を明らかにするためには、統計学の利用が必要である。また、腸内細菌叢のような環境では、複数の異なる特徴的なタイプの微生物群集(腸内細菌型)が存在することが示されている。つまり、メタデータや環境情報だけを使って微生物コミュニティを典型的なコミュニティの集合に分類すると、グループが粗くなりすぎてしまう可能性がある。そこで、階層的クラスタリング手法により、MAP参照マイクロバイオームをコミュニティの類似性に基づいてあらかじめグループ分けした。このようにして、研究者は自分のサンプルとMAPの最も類似したタイプの特徴的な環境との間に存在することが判明した差異を得ることができる。
  • 2つのサンプルグループ間の微生物量の統計的有意差は、ユーザー提供サンプルとグループ、またはユーザーサンプルとMAP提供リファレンスサンプル間の両方について、MAPウェブサイトを使用して計算することができる。これにより、研究者は研究している環境に特有な微生物分類を特定することができる。

 

作成中

引用

MAPseq: highly efficient k-mer search with confidence estimates, for rRNA sequence analysis 
João F Matias Rodrigues, Thomas S B Schmidt, Janko Tackmann, Christian von Mering
Bioinformatics, Volume 33, Issue 23, 01 December 2017, Pages 3808–3810