macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

細菌ゲノムにコードされた二次代謝産物の多様性を探索するためのウェブリソース BGC Atlas

2024/11/01 タイトル変更

 

 二次代謝産物とは、生物の発生には必須ではないが、生態学的・生理学的に重要な利益をもたらす化合物のことである。これらの化合物は、医療、バイオテクノロジー、農業に応用されている。二次代謝産物の生産は、生合成遺伝子クラスター(BGC)にコードされている。メタゲノミクスの登場により、研究者は環境サンプルから直接BGCを研究できるようになり、これまでにない化学反応をコードする、これまで知られていなかった数多くのBGCが同定された。ここでは、メタゲノムにおけるBGCの多様性の探索と解析を容易にするウェブリソース、BGC Atlas (https://bgc-atlas.cs.uni-tuebingen.de)を紹介する。BGCアトラスは、一般に公開されているデータセットからBGCを同定・クラスタリングし、BGCと遺伝子クラスター・ファミリー(GCF)のメタデータを意識した探索のための一元化されたデータベースとウェブインターフェースを提供する。MGnifyの35,000以上のデータセットを解析し、約180万個のBGCを同定し、GCFにクラスタリングした。解析の結果、リボソームで合成され、翻訳後に修飾されたペプチドが最も豊富な化合物クラスであり、ほとんどのGCFが高い環境特異性を示すことが示された。本ツールにより、研究者は環境サンプル中のBGCの多様性を容易に探索・解析できるようになり、細菌の二次代謝産物に関する理解が大幅に深まり、生合成能を形成する生態学的・進化的要因の同定が促進されるものと期待される。

 

特徴(helpより)

  • メタゲノミックデータセットは、一般に公開されているリポジトリ(MGnify)から収集される。

  • データセットは、アセンブルされたコンティグと関連するメタデータを抽出するために処理され、各BGCの詳細な環境コンテキストを提供する。

  • メタゲノムアセンブリのBGCの同定とアノテーションにantiSMASHツールを使用。

  • 同定されたBGCはBiG-SLiCEを用いて遺伝子クラスター・ファミリー(GCF)にクラスタリングされる。

  • 異なる環境におけるGCFの分布を詳細に解析することで、生息地特異性や生態適応性を明らかにする。

  • 直感的なウェブインターフェースにより、BGC、GCF、サンプルを簡単に探索できる。

  • ユーザーは、特定の基準に基づいてBGCをフィルタリングおよび検索し、さまざまなバイオームにわたる分布を視覚化し、類似したクラスターをデータベースに照会できる。

 

webサービス

https://bgc-atlas.cs.uni-tuebingen.de/ にアクセスする。

 

BGCアトラスのインターフェースは、Home、Samples、BGCs、GCFs、Searchの5つとダウンロード、Aboutで構成されている。

 

自由に拡大縮小してサンプルコレクションを選択できる。

 

IDをクリックするとAntiSMASHビューアにジャンプする。


sample

サンプル名、バイオーム、同定されたBGCの数、関連するメタデータの情報を含むメタゲノム・サンプルの表が表示される。

 

左上のFilterメニューから、バイオームタイプやBGC数などの特定の条件に基づいてフィルタリングおよび検索ができる。

 

Biome & Contains & "soil"で絞り込んだ。

左端をクリックするとAntiSMASHビューアにジャンプする。

 

SampleとメタゲノムアセンブリのアクセッションIDはMGnifyにリンクしている。

 

BCGs

メタゲノムサンプルで同定された個々の生合成遺伝子クラスターの詳細を閲覧できる。

上部にはOverviewが示される。

 

表には、すべての BGC のリスト、そのchemicalのカテゴリーとタイプ、クラスター化した GCF、およびそのメンバーシップ値が表示される。

赤色で表示されているBGCエントリーは、そのBGCがGCFの推定メンバーであることを示している(メンバーシップ値0.4以上)。BGC IDをクリックすると、AntiSMASHビューアでBGCエントリーが開く。表示されているリストはCSVまたはExcelファイルとしてダウンロードできる。

 

GCF

データベースで同定された遺伝子クラスターファミリー(GCFs)を、BGCの数、その産物のタイプ、およびそれらが見出されるさまざまなバイオームにわたる分布に関する情報とともに示す。

ページの左上隅にあるFilterメニューからBGCの数、製品またはバイオームのタイプなどの特定の基準に基づいて、GCFをフィルタリングおよび検索できる。

 

GCFのIDをクリックするとそのGGFの統計や地理的分布を確認できる。

 

Search

ユーザーが他のソースから同定したBGCのantiSMASH互換GenBankファイルを用いて、BGC-Atlasデータベースとの相同性検索を行うことができる。

生合成遺伝子クラスターを含む1つまたは複数のGenBankファイル(antiSMASHの結果)をアップロードする。アップロードすると、類似クラスターをデータベースから検索できる。検索結果は表形式で表示され、BGC名、GCF ID、メンバシップ値が表示される。

 

Download

BGC Atlasデータベースで使用されているGenBankファイルやBiG-SLiCEクラスタリング結果をダウンロードできる。またデータベースの完全なダンプを使用して、BGCアトラスデータベースのローカルインスタンスをセットアップし、BGC、GCF自体、およびサンプルに関連するすべてのメタデータを含む、含まれるすべてのデータにプログラムでアクセスすることができる。

 

 

引用

BGC Atlas: a web resource for exploring the global chemical diversity encoded in bacterial genomes

Caner Bağcı, Matin Nuhamunada, Hemant Goyat, Casimir Ladanyi, Ludek Sehnal, Kai Blin, Satria A Kautsar, Azat Tagirdzhanov, Alexey Gurevich, Shrikant Mantri, Christian von Mering, Daniel Udwary, Marnix H Medema, Tilmann Weber, Nadine Ziemert

Nucleic Acids Research, Published: 29 October 2024

 

関連