macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

計算とハイスループット遺伝学で細菌の異化経路のギャップを埋める GapMind for carbon sources

 

 新規の異化酵素とトランスポーターを発見するために、本著者らは29のバクテリアのハイスループット遺伝子データと、異化経路のギャップを見つける自動化ツールを組み合わせた。GapMind for carbon sourcesは、細菌および古細菌ゲノムにおける62種類の化合物の取り込みと異化を自動的にアノテーションする。29の細菌が利用する化合物について、GapMindが予測した経路のギャップを系統的に調べ、変異体フィットネスデータを用いて、その利用に関与する追加遺伝子を見つけた。その結果、グルコサミン、シトルリン、ミオイノシトールラクトース、フェニルアセテートの利用に関する新規経路や酵素を同定し、299の分岐した酵素やトランスポーターをアノテーションした。また、発表された報告から125のタンパク質をキュレーションした。遺伝子データのある29の細菌について、GapMindは利用される炭素源の85%について信頼度の高い経路を発見した。多様な細菌と古細菌では、利用される炭素源の38%が信頼度の高い経路を持ち、フィットネスベースのアノテーションと本キュレーションを組み込むことにより、27%から改善された。GapMind for 炭素源はウェブサーバー(http://papers.genomics.lbl.gov/carbon)として利用可能で、典型的なゲノムに対してわずか30秒で完了する。

 

webサービス

GapMind for catabolism of small carbon sources

https://papers.genomics.lbl.gov/cgi-bin/gapView.cgi?set=carbonにアクセスする。



データベースに登録されているバクテリアアーキアの異化反応の酵素をコードする遺伝子を探索できる。

 

データベースの既知ゲノムアセンブリを対象として探索できる。

 

あるいは、ユーザーがプロテオーム配列をアップロードする。

 

 

出力例

GapMind for carbon sourcesは、オリジナルのGapMindのディスプレイ方法と同じ方法で結果を示す。つまり、ゲノムと炭素源が与えられると、その化合物の異化反応に関わる最も確からしいパスウェイを特定し、ギャップがあれば赤で強調表示する。

 

オリジナルのGapMindと同じで、緑が高信頼度(見つかる)、黒が中信頼度、赤が低信頼度(見つからない)を意味している。1つ以上の酵素が見つからなかった場合、表の左側のpathwayの化合物は赤となる(代謝できない)。下の図なら、acetateを異化的に代謝する酵素遺伝子は見つかるか、D-alanineを代謝する酵素遺伝子は見つからない。



上のボタンから完全な順にソートできる。

 

パスウェイ名をクリックするとより詳細な情報を閲覧できる。

表はBest candidate、2nd candidateに分かれて探索結果が表示される。また、知られているAlternative stepsの酵素遺伝子の探索結果も示される。

 

下のリンクからは、PaperBLAST(紹介)とCurated BLAST(紹介)、Clusters of characterized proteins(下で説明)にアクセスできる。

 

論文より

  • 炭素源のGapMindはアミノ酸のGapMindと同様のアプローチを用いている。GapMindは既知のパスウェイと実験的に特徴づけられたタンパク質データベースに依存している。
  • さらに29の従属栄養細菌から得られた大規模な変異体フィットネスデータを用い、これらの細菌それぞれについて、バーコード化された数万個のトランスポゾン変異体のプールを様々な定義された培地で増殖させ、各変異体の存在量の変化をDNA配列決定によって定量化した。この方法を用いて、555の酵素と161のトランスポーターまたはトランスポーター成分からなる716のタンパク質をアノテーションした。(フィットネスデータから既に機能を同定していたタンパク質は、これらの数には含まれていない)。

  • GapMindは、19種類のアミノ酸、19種類の単糖または糖酸、5種類の二糖、11種類の有機酸を含む、62種類の炭素源の利用について記述している(論文の表1)。
  • 各ステップの定義を助けるために、"curated clusters "ツールを構築した(https://papers.genomics.lbl.gov/cgi-bin/curatedClusters.cgi?set=carbon)。このツールは、検索語にマッチする、またはステップ定義に含まれるキュレートされたタンパク質配列をクラスタリングする。また、化合物のトランスポーター候補を類似トランスポーターのファミリーにクラスタリングすることもできる。デフォルトでは、30%の同一性と75%のアラインメントカバレッジ(両方向)でクラスタリングされるが、これは変更可能である。特に、多くのABCトランスポーターは、互いに類似した2つのパーミアーゼサブユニットを含んでいる。

引用

Filling gaps in bacterial catabolic pathways with computation and high-throughput genetics
Morgan N Price, Adam M Deutschbauer, Adam P Arkin

PLoS Genet. 2022 Apr 13;18(4):e1010156.

 

関連

https://kazumaxneo.hatenablog.com/entry/2020/06/26/133201

https://kazumaxneo.hatenablog.com/entry/2018/08/05/203339