macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

既知生合成遺伝子クラスターのデータベース MIBiG 2.0

 

 植物、微生物、菌類は、多くの場合、1つまたはいくつかの種にユニークな多種多様な特殊な代謝物を生成する。文明の夜明けから、人間は薬用、経済的、またはレクリエーション目的でこの宝の山を利用している。過去10年以内に、ゲノムに基づいた特殊な代謝産物の発見は、科学界と商業環境の両方で広く採用されてきた。これらの努力の規模は、公共データベースでのゲノムおよびメタゲノムアセンブリの可用性の継続的な増加のため、継続的に成長している。これらの配列は、1つまたは複数の特定の化合物の生合成経路をコードするマルチ酵素遺伝子座の生合成遺伝子クラスター(BGC)の存在に基づいてマイニングできる。

 したがって、antiSMASH(ref.1)やClusterFinder(ref.2)などの計算ツールを使用して、数千のBGC候補が特定されている。 IMG-ABC(ref.3)やantiSMASH-DB(ref.4)などのデータベースには、非常に多様な範囲の天然物クラスをコーディングする可能性のある、数千ものそのような計算上予測されたBGCが格納されている。現在および将来の候補BGCの機能と新規性を解明するには、以前に特徴付けられたBGCに関する知識が不可欠である。これは、既知の化学構造の分子に関連するBGCの標準化された蓄積と抽出を必要とする。これは、関連する知識が通常、科学文献に埋もれているためである。

 このための最初のステップは2013年に行われ、ClusterMine360(ref.5)が登場した。これは、約300の遺伝子クラスターに関するデータを含む既知の製品を含むBGCの最初のデータベースである。 2015年に、MIBIG(生合成遺伝子クラスターに関する最小情報)データ標準とリポジトリが確立された。これには、コミュニティの努力により手動でキュレーションされた1170のBGCエントリが含まれ、その結果はかなり単純なWebアプリケーションからアクセスできる(ref.6) 。現在、MIBiGリポジトリは、既知の機能のBGCのセントラルリファレンスデータベースになり、KnownClusterBlastモジュールを介してantiSMASH(ref.1)の比較分析の基礎を提供する。微生物および微生物群集の小規模および大規模研究の中心となるBGC機能と新規性の多くの計算分析を可能にした。最近、MIBiGを使用して、研究されていない門からの376のメタゲノムアセンブルされた土壌細菌のBGCの並外れた新規性を評価および強調し、これらのBGCのほとんどがMIBiGからの遺伝子クラスターとの相同性を欠いていることを示した。同様に、Bahram et al (ref.8, pubmed)はMIBiGを使った相同性検索により、アノテーション付けできるMIBiG遺伝子クラスターのセットに基づいて、7560メタゲノムサンプル全体で抗菌活性に関連する真菌BGCを特定した。したがって、そのような「抗菌」BGCの豊富さは、土壌全体の抗菌薬耐性遺伝子の存在と相関していることを示した。さらに別の使用法がClusterCADツール(ref.9)に示されている。このツールは、新しい生化学パスウェイのコンピューター支援設計の出発点としてMIBiGからBGCデータを取得する。

 ここでは、更新されたMIBiGバージョン2.0を提供する。これは、過去5年間で851の新しいエントリが追加されて大幅に拡張された(論文図1)。さらに、データベース全体の広範な再アノテーション付けを行い、データスキーマを改善し、数百の文献と化学構造を追加し、最近出現した化学構造と分析データのデータベースへのクロスリンクを提供することにより、全体的なデータ品質を向上させた。最後に、化合物名、分類識別子、または生合成クラスに基づいた高速フィルタリングを有効にし、ブールクエリの構築を容易にすることで、便利な機能をオンラインリポジトリに追加し、より使いやすくした。

 


使い方

https://mibig.secondarymetabolites.orgにアクセスする。

f:id:kazumaxneo:20191210115145p:plain

 

Statistics

生産物質名、属名などで検索できる。

Secondary Metabolite record counts。

f:id:kazumaxneo:20191211234356p:plain

属はデータベース登録cluster数が多い順に並んでいる。ここでは636もアサインされているStreptomycin属をクリックした。

f:id:kazumaxneo:20191211230223p:plain

actinomycin Dをクリックした。

f:id:kazumaxneo:20191211230401p:plain

 

遺伝子クラスターが表示される。

f:id:kazumaxneo:20191211230453p:plain

 

右上からクラスターの遺伝子のGenBankファイルをダウンロードできる。

f:id:kazumaxneo:20191211231104p:plain

 

Compounds

f:id:kazumaxneo:20191211233137p:plain

Genes

f:id:kazumaxneo:20191211233158p:plain

History

f:id:kazumaxneo:20191211233226p:plain

Similar known gene clusters(一番上がこのデータベースのgene cluster(クエリ))

f:id:kazumaxneo:20191211233231p:plain



Search

Gene clusterをキーワード検索できる。

f:id:kazumaxneo:20191211233659p:plain


 

 

引用
MIBiG 2.0: a repository for biosynthetic gene clusters of known function
Kautsar SA, Blin K, Shaw S, Navarro-Muñoz JC, Terlouw BR, van der Hooft JJJ, van Santen JA, Tracanna V, Suarez Duran HG, Pascal Andreu V, Selem-Mojica N, Alanjary M1, Robinson SL, Lund G, Epstein SC, Sisto AC, Charkoudian LK, Collemare J, Linington RG, Weber T, Medema MH

Nucleic Acids Res. 2019 Oct 15. pii: gkz882. doi: 10.1093/nar/gkz882

 

関連