macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

細胞外多糖類生合成遺伝子クラスターを発見する epsSMASH

 

 バイオフィルムは、自然環境および人工環境における細菌のデフォルトの生活様式を表し、細胞外多糖類(exoPS)はバイオフィルムマトリックスの重要な構造的および機能的構成要素として機能する。その重要性にもかかわらず、これらの環境でのexoPSの産生はほとんどわかっていない。この論文では、細菌ゲノム中の既知および新規のexoPS生合成遺伝子クラスター(BGC)を予測するためのバイオインフォマティクスツールおよびウェブサービスであるepsSMASHを紹介する。ベンチマークにより、exoPS遺伝子クラスターの包括的な検出には、非常に連続した高品質のゲノムアセンブリが必要であることが示された。著者らは、ヒトの腸、土壌、海洋、および廃水処理システムの活性汚泥という4つの主要な生態系を表す高品質の細菌ゲノムカタログにepsSMASHを適用した。すべてのカタログにおいて、epsSMASHはほとんどのゲノム(52.8〜85.4%)でexoPS BGCを特定し、ゲノムあたり平均1〜2個のexoPS BGCだった。ゲノムあたりの exoPS BGC の数は非常に多様で、分類群によっては最大 19 個の異なる exoPS BGC が含まれていた。Pel BGC は、ヒトの腸、海洋、活性汚泥のマイクロバイオームに豊富に存在し、14 の異なる門で検出されたため、これらの環境では系統的に最も広範囲に分布する BGC になる。検出された exoPS BGC の大部分 (62-96%) は特徴づけられていないものだった。未解析のシステムから遺伝子クラスター ファミリーを構築することで、系統的に広範囲に分布する新規の exoPS BGC を同定した。活性汚泥のマイクロバイオームからの新規 exoPS 遺伝子クラスターを調査し、それが Sphingomonadales 目のほとんどの属で保存されていることを示した。本結果は、環境マイクロバイオームにおける未解析の exoPS 遺伝子クラスターの驚くべき数を強調し、epsSMASH が新規 exoPS システムを同定および分類するための効果的なツールであることを確立した。

 

CLI


Documentation

https://docs.epssmash.secondarymetabolites.org/

 

ここではepsSMASHのウエブサービスを紹介します。

webサービス

https://epssmash.secondarymetabolites.org/#!/startにアクセスする。

 

連続性の高い細菌ゲノム配列のgenbankファイルを指定する(example)。fastaやアクセッションIDでの指定にも対応している。

 

出力例

epsSMASHはantiSMASHフレームワークで構築されており、antiSMASHと同様のインターフェースで利用できる。

 

4つの細胞外多糖類生合成遺伝子クラスター領域が予測された。

 

 

それぞれの遺伝子の塩基配列とタンパク質配列をダウンロードできるようになっている。

 

またここからNCBI BlastPサービスにジョブを投げることもできる。

 

全ての結果は右上のボタンからダウンロードできる。

 

引用

epsSMASH uncovers exopolysaccharide biosynthetic gene clusters in environmental and human microbiomes

Anders Ogechi Hostrup Daugberg,  Angie Waldisperg,  Marie Riisgaard-Jensen,  Sofie Zacho Vestergaard, Roberto Sánchez Navarro,  Tilmann Weber,  Kai Blin, Simon Shaw,  Per Halkjær Nielsen,  Morten Kam Dahl Dueholm

bioRxiv, Posted December 23, 2025

 

関連

 

おけましておめでとうございます。去年の年末は投稿を急いでいて12月頭にブログ更新が完全に止まってしまいました。今年はできる範囲で更新できればと思っています。今年もどうかよろしくお願いいたします。

 

<宣伝>

微力ながら以下の書籍の執筆に少しだけ関わらせていただきました。

1、論文図表を読む作法PREMIUM

各分野の研究者が論文の図表を例に取り上げながら、さまざまな実験・解析手法を簡潔に解説する内容となっています。前著からオミクス解析、臨床データ解析、機械学習の章が拡充され、収録項目は全173分野・計173項目に及びます !

私は細菌ゲノムアセンブリ、バルクRNA-seqなどを担当しました。

 

実験医学増刊 Vol.43 No.20 オミクスデータを探す!使いこなす!公共データベース厳選53

本書では、生命医科学分野の膨大な公共データベースの中からゲノム・タンパク質・代謝物に関する特に有用な53のデータベースを厳選し、データベースの特徴や活用方法、具体的な使い方を紹介しています。私はSTRINGについて紹介しています。

どちらの書籍も、昨年末に出版されました。もしよろしければ書店で手に取ってご覧ください!