macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

陸域メタゲノムのキュレーションされたメタデータ公開リポジトリ TerrestrialMetagenomeDB

2022/06/25 タイトル変更

 

微生物群集の遺伝的可能性に着目したマイクロバイオーム研究(メタゲノム研究)は、微生物生態学の分野では標準的なものとなった。MG-RASTとSequence Read Archive (SRA)という2つの主要なメタゲノムリポジトリには、202,858以上の公開メタゲノムがあり、その数は指数関数的に増加している。しかし、データベースのマイニングは、誤ったアノテーション、誤解を招くようなデータ、分散化されたデータのために困難な場合がある。TerrestrialMetagenomeDBの主な目的は、研究者がメタアナリシスで新しいデータセットと比較できるような、興味のある陸域のメタゲノムを簡単に見つけることである。陸上メタゲノムは、海洋環境に属さないメタゲノムと定義した。また、テキストマイニングを用いてデータベースを作成し、バイオマスや物質など、陸域メタゲノムの環境的側面をよりよく文脈化するための潜在的な記述キーワードを付与した。本データベースには、SRAとMG-RASTの15 022件の陸域メタゲノムが収録されている。ダウンロード可能なデータ量は68Tbpになっている。合計で199の陸域用語が14のカテゴリに分類されている。これらのメタゲノムは、83の国、30のバイオマス、7つの主要な情報源にまたがっている。TerrestrialMetagenomeDBは、https://webapp.ufz.de/tmdb で公開されている。

 

 

 

Help

TerrestrialMetagenomeDBのHelpタブ参照

 

webサービス

https://webapp.ufz.de/tmdb/

f:id:kazumaxneo:20210221115039p:plain

 

COMPLETE DATASETを選択。TMDBがメタデータを整理している公開データのメタデータと、その公開サイトへのリンクが表示される。

f:id:kazumaxneo:20210221115846p:plain


様々な条件で絞り込むことができる。

Source DatabaseはMG-RASTかSRAを選択。

f:id:kazumaxneo:20210221115947p:plain

 

TMDB Material

f:id:kazumaxneo:20210221120112p:plain

 

シークエンシングリード数

f:id:kazumaxneo:20210221120149p:plain

配列数の少ないデータは、RAWデータではなく、アセンブル配列がデポジットされていることが関係している可能性がある。データセットが真のメタゲノムであることをより確実にしたい場合は、ベースペア数や配列数の範囲内でデータセットを選択するフィルターを使用する。例えば配列数が500万以上のデータセットのみを表示する(helpより)。

 

Sequencing Platform

f:id:kazumaxneo:20210221120223p:plain



TMDB Biome(ENVO term

f:id:kazumaxneo:20210221120423p:plain

 

Assembled

f:id:kazumaxneo:20210221120435p:plain

 

More filtersをクリックするとより詳細なフィルタ設定を追加できる。More filtersをクリック、

f:id:kazumaxneo:20210221121332p:plain

展開された。緯度経度、高さ(または深さ)、気温、pH、シークエンシングリードのパラメータなどが選択できる。

f:id:kazumaxneo:20210221121433p:plain

TMDBが(EnvOからの派生で)定義する様々なAttribute nameでフィルタリングできる。各属性の詳細はHELPタブの”7. What does each attribute of the database mean?”を参照して下さい。

 

Interactive mapタブ

f:id:kazumaxneo:20210221122548p:plain

 

インタラクティブマップでは、ユーザーはインタラクティブな方法で興味のある場所を直視することができる。

 

左側のマップツールバーから描画ツール(多角形または長方形)を選択し、興味のある地域を囲む。

f:id:kazumaxneo:20210221123031p:plain

 

囲んだ。選択したメタゲノムデータがマップの下に表示される。

f:id:kazumaxneo:20210221123332p:plain

Show filtersボタンでさらに絞り込むことができる。また、選択したメタデータcsvファイルとしてダウンロードできる。


インタラクティブマップからアクセスできるのは、有効な座標を持つメタゲノムのみであることに注意する。全てのデータは"Complete dataset "タブから確認する。

 

引用

TerrestrialMetagenomeDB: a public repository of curated and standardized metadata for terrestrial metagenomes
Felipe Borim Corrêa, João Pedro Saraiva, Peter F Stadler, Ulisses Nunes da Rocha
Nucleic Acids Research, Volume 48, Issue D1, 08 January 2020, Pages D626–D632

 

関連