macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

細菌の代謝パスウェイを予測し、正確な代謝モデルを再構築するための情報を提供する gapseq

 

微生物のゲノムスケールの代謝モデルは、生物の遺伝子型から表現型を予測するための強力なフレームワークである。しかし、手動での再構築は手間がかかる一方で、自動再構築では既知の代謝プロセスを再現できないことがよくある。gapseqは、精査された反応データベースと新しいギャップフィリングアルゴリズムを用いて、代謝経路を予測し、微生物の代謝モデルを自動的に再構築する新しいツールである。科学文献や14,931種類の細菌の表現型に関する実験データを基に、gapseqは、酵素活性、炭素源利用、発酵生成物、微生物群集内の代謝相互作用を予測する上で、最新のツールよりも優れていることを実証している。

 

Githubより

gapseqには2つの基本的な使用例がある。1つは代謝パスウェイの予測で、もう1つは代謝ネットワークの再構築である。ゲノム情報、パスウェイ、反応に関するデータベースに基づいて、gapseqは以下のように使用できる。

  • 様々なデータベースからの代謝パスウェイの予測
  • トランスポーターの推論
  • 代謝モデルの構築
  • マルチステップのギャップフィリング

 

Documentation

https://gapseq.readthedocs.io/en/latest/

 

インストール

ubuntu18.04で、dockerイメージをビルドしてテストした(*1)。

Github

#依存
sudo apt install ncbi-blast+ git libglpk-dev r-base-core exonerate bedtools barrnap bc -y
R -e 'install.packages(c("data.table", "stringr", "sybil", "getopt", "reshape2", "doParallel", "foreach", "R.utils", "stringi", "glpkAPI", "CHNOSZ", "jsonlite"))'
R -e 'if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager"); BiocManager::install("Biostrings")'

#本体
git clone https://github.com/jotech/gapseq
cd gapseq

> ./gapseq

__ _ __ _ _ __ ___ ___ __ _

/ _` |/ _` | '_ \/ __|/ _ \/ _` |

| (_| | (_| | |_) \__ \ __/ (_| |

\__, |\__,_| .__/|___/\___|\__, |

|___/ |_| |_|

 

Informed prediction and analysis of bacterial metabolic pathways and genome-scale networks

 

Usage:

gapseq test

gapseq (find | find-transport | draft | fill | doall | adapt) (...)

gapseq doall (genome) [medium] [Bacteria|Archaea]

gapseq find (-p pathways | -e enzymes) [-b bitscore] (genome)

gapseq find-transport [-b bitscore] (genome)

gapseq draft (-r reactions | -t transporter -c genome -p pathways) [-b pos|neg|archaea|auto]

gapseq fill (-m draft -n medium -c rxn_weights -g rxn_genes)

gapseq adapt (add | remove) (reactions,pathways) (model)

 

Examples:

gapseq test

gapseq doall toy/ecoli.fna.gz

gapseq doall toy/myb71.fna.gz dat/media/TSBmed.csv

gapseq find -p chitin toy/myb71.fna.gz

gapseq find -p all toy/myb71.fna.gz

gapseq find-transport toy/myb71.fna.gz

gapseq draft -r toy/ecoli-all-Reactions.tbl -t toy/ecoli-Transporter.tbl -c toy/ecoli.fna.gz -p toy/ecoli-all-Pathways.tbl

gapseq fill -m toy/ecoli-draft.RDS -n dat/media/ALLmed.csv -c toy/ecoli-rxnWeights.RDS -g toy/ecoli-rxnXgenes.RDS

gapseq adapt add 14DICHLORBENZDEG-PWY toy/myb71.RDS

 

Options:

test Testing dependencies and basic functionality of gapseq.

find Pathway analysis, try to find enzymes based on homology.

find-transport Search for transporters based on homology.

draft Draft model construction based on results from find and find-transport.

fill Gap filling of a model.

doall Combine find, find-transport, draft and fill.

adapt Add or remove reactions or pathways.

-v Show version.

-h Show this screen.

-n Enable noisy verbose mode.

 

 

 

テストラン

全て実行。 

./gapseq doall toy/myb71.fna.gz

環境によって変わるが、数時間ほどかかる。

myb71-Transporter.tbl

f:id:kazumaxneo:20210315175929p:plain

 

myb71-all-Reactions.tbl

f:id:kazumaxneo:20210315180039p:plain

bad_blast(カットオフに必要なビットスコア、カバレッジアイデンティティのいずれかが低い品質のブラストヒット)、good_blast(すべてのカットオフがブラストヒットを満たす)、no_blast(ブラストヒットが見つからない)、no_seq_data(利用可能な配列データがない)、spontaneous(酵素が必要ない)と定義されている。

 

myb71-all-Pathways.tbl

gapseq findコマンドで検討されたすべてのパスウェイの詳細情報。Blastは、ホモロジー検索の結果

f:id:kazumaxneo:20210315180233p:plain

 

**関連するパスウェイのステータスは、パスウェイが予測された基準の背景を示している。full(全ての反応が検出された)、keyenzyme(検出されたキー反応はパスウェイの存在を示す(少なくともパスウェイ反応の66%が存在する))、NA(パスウェイの存在は予測されない)、threshold(少なくとも80%の反応が存在するためパスウェイは存在する)と定義されている。

 

Outputファイルに関してはDocumentで説明されています。

 

チュートリアル

E. rectaleとB. longumのゲノムスケールのモデルをgapseqを用いて再構築し、2つのモデルを共成長させてシミュレーション、相互作用を調べる。

https://gapseq.readthedocs.io/en/latest/tutorials/crossfeeding.html

時間を見つけて追記します。

 

引用
gapseq: informed prediction of bacterial metabolic pathways and reconstruction of accurate metabolic models
Johannes Zimmermann, Christoph Kaleta, Silvio Waschina

Genome Biol. 2021 Mar 10;22(1):81

 

関連

 

*1

Dockerfileを書いてビルドした。

#################################################
FROM ubuntu:18.04

LABEL \ description="Base image for gapseq"
#################################################

WORKDIR /home

#locationを聞かれないようにする
ENV DEBIAN_FRONTEND=noninteractive

RUN apt update -y && apt install -y \ ncbi-blast+ git libglpk-dev r-base-core exonerate bedtools barrnap bc locales tzdata wget

#不要かもしれない
RUN apt update -y && apt install -y language-pack-en

RUN R -e 'install.packages(c("data.table", "stringr", "sybil", "getopt", "reshape2", "doParallel", "foreach", "R.utils", "stringi", "glpkAPI", "CHNOSZ", "jsonlite"))'

RUN R -e 'if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager"); BiocManager::install("Biostrings")'

RUN git clone https://github.com/jotech/gapseq

#bash
Shell ["/bin/bash", "-c"]

WORKDIR /home/gapseq/
#################################################

 ビルド

docker build -t kazumax/gapseq .