macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

植物ゲノムの代謝遺伝子クラスターを検出する PhytoClust

 

 代謝遺伝子クラスター(MGC)は、特定の代謝パスウェイのゲノム上で共局在し、潜在的に共制御される遺伝子である。細菌のオペロンとは対照的に、それらは単一の転写ユニットの制御下にはない。 MGCは真菌ゲノムによく見られ、MGCは植物の例外としてのみ発生すると長い間想定されてきた(ref.1)。ただし、近年では 20を超えるMGCがさまざまな種で実験的に特徴づけられており、その大部分は植物の特殊な代謝に関連している(2–6)。植物のMGCは、単子葉および双子葉の両方の種のゲノムにまたがり、ベンゾオキサジノイド、シアン配糖体、テルペノイド、アルカロイドなどのさまざまなケミカルクラスに関連する最終産物の生合成を媒介する(ref.3)。重要なこととして、報告されている植物MGCの範囲には、薬学上および農学上重要な化学物質の合成のための生合成反応が含まれる。

 植物MGCの一般的な記述子は、特殊な代謝産物の合成に関与する酵素をコードする、少なくとも3つ、時には2つの非相同な生合成遺伝子の隣接局在である(ref.4)。植物のMGC原核生物のオペロンとは独立して進化したようである。通常、植物MGCは、いわゆる「シグネチャ酵素」、すなわち生合成パスウェイの最初のコミットされたステップを触媒し、以下の特殊な代謝産物の足場を合成する酵素をコードする1つの遺伝子で構成されている。残りの遺伝子は、足場を修飾して目的の最終産物を形成する後続の「調整酵素」をコードする(ref.4)。さらに、シグネチャ遺伝子は植物の一次代謝の遺伝子と相同性を共有しているため、植物のMGCは遺伝子の重複と新機能化による追加の調整酵素の補充によって形成されたと広く想定されている。

(一部略)

 

 インシリコMGC予測ツールであるPhytoClustを開発および適用した。 PhytoClustでは、既知の植物MGCタイプの検索と、新規タイプのクラスターのマイニング(つまり、酵素クラス構成の観点から)が可能である。候補クラスターにある遺伝子の共発現分析は、選択した植物種で利用できる。 PhytoClustは、新しいゲノムアセンブリが利用可能になると、広範囲の植物種における新規MGCの特性評価を強化すると予想している。

 PhytoClustのワークフローは、(ref.18)に詳述されているコアAntismash実装に従う。クラスター分析パイプラインは、入力としてGBK、EMBL、またはFASTAファイルを使用し、入力ファイルから遺伝子を抽出するか、指定されていない場合、GlimmerHMMを使用して入力ヌクレオチド配列から遺伝子を予測する(ref.21)。(一部略)オプションの共発現分析については、「PhytoClustの共発現モジュール」で詳しく説明している。結果の出力には、HTML、GBK、EMBL、TXT、およびXLSファイルが含まれる。

 

 

about

http://phytoclust.weizmann.ac.il/about/

 

使い方

http://phytoclust.weizmann.ac.ilにアクセスする。

f:id:kazumaxneo:20191212003345p:plain

 

サーバーに既に保存されている植物ゲノムの中から選択するか、またはユーザーの配列をアップロードする。アップロードする場合、FASTAファイルかEMBL、GBK形式のアノテーションファイルを指定する。FASTAファイルを指定した際は遺伝子予測されてから用いられる。

f:id:kazumaxneo:20200629203332p:plain

ファイルサイズが1.5GBを超える場合、染色体ごとにアップロードするか関心のある領域だけアップロードする。 必要に応じて共発現解析のチェックもつける。

 

メールアドレス記載すると、計算終了後にダウンロードリンクを含む通知が届く。結果は計算終了後7日間ダウンロード可能になっている。検出可能な遺伝子クラスターについてはaboutを参照。

引用

The PhytoClust tool for metabolic gene clusters discovery in plant genomes
Nadine Töpfer, Lisa-Maria Fuchs, Asaph Aharoni

Nucleic Acids Res. 2017 Jul 7; 45(12): 7049–7063