macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

バクテリアのゲノム縮小のための遺伝子必須性予測と欠失の設計を行う DELEAT

2021 10/7 追記

 

 遺伝子の必須性を研究することは、生命の基本原理を理解する上で基本的なことであり、また多くの分野で応用されている。ここ数十年の間に、さまざまな実験やバイオインフォマティクスの手法を用いて、何十もの必須遺伝子セットが決定され、これらの情報はモデル生物のゲノム縮小に役立っている。遺伝子の必須性を予測するために、複数のin silico戦略が開発されてきたが、最適なアルゴリズムや遺伝子の特徴のセットはまだ見つかっていない。特に、機能アノテーションが不完全な非モデル生物の場合はそうである。

 DELEAT v0.1 (DELetion design by Essentiality Analysis Tool)は、使いやすいバイオインフォマティクスツールであり、in silicoの遺伝子必須性分類器をパイプラインに統合し、あらゆる細菌ゲノムにおいて大規模な欠失を自動的に設計することができる。この分類器は、実験データや機能アノテーションに依存しない、わずか6つの遺伝子特徴に基づく新しいロジスティック回帰モデルで構成されている。概念実証として、このパイプラインをBartonella quintana str. Toulouseのゲノムに適用した。すでに縮小しているこのゲノムでは、ゲノムの29%に相当する35個の可能性のある欠失が特定された。

 

Githubより

DELEATは、バクテリアゲノムにおける大規模なゲノム欠失を設計するためのバイオインフォマティクス解析パイプラインです。DELEATは、Database of Essential Genes (DEG)から生物を選んで学習した機械学習ロジスティック回帰分類法を用いて、ゲノム上の各遺伝子に必須性スコアを割り当て、この情報を用いて非必須領域を決定します。DELEATは、欠失の設計が完了すると、ユーザーに有用な情報をレポートの形で提供するとともに、ゲノムの縮小の可能性を可視化する円形のゲノムプロットを出力する。

 

インストール

mambaでPythonの環境を作ってテストした(ubuntu18)。

依存

  •  

Github

git clone https://github.com/jime-sg/deleat.git deleat && cd deleat
mamba create --name deleat-v0.1 --file deleat_env.txt
conda activate deleat-v0.1

#dockerを使ったラン方法も用意されています

$ python deleat-v0.1/deleat.py -h

usage: deleat <step name> <step arguments>

valid steps are:

  1. predict-essentiality

  2. define-deletions

  3. revise-deletions

  4. summarise

  5. design-all-primers / design-primers

 

#各プロセスのヘルプも用意されている(deleat.py predict-essentiality -h)

 

実行方法

実行したいプロセスのコマンド名を指定する。

  1. predict-essentiality(バクテリアのゲノムに含まれるすべての遺伝子について必須性スコアを取得)
  2. define-deletions(欠失を計算)
  3. revise-deletions(欠失リストを再定義する。)
  4. summarise(欠失デザインとゲノム縮小プロセスに関する最終レポートを作成)
  5. design-all-primers / design-primers(メガプライミングによる大規模ゲノム欠失のためのプライマーを設計)

ランするには、対象となる生物のGenBankアノテーションファイルが必要。

 

1、(ユニークな) locus_tag IDでアノテーションされている全ての遺伝子について Essentiality スコアを計算する。Oriとterの座標がわかっている場合は指定する。指定しない場合はGC skew法で推定される。

deleat predict-essentiality -g genbank_file -o outdir_step1 -p1 <ori> -p2 <ter> -n 8
  • -g    original GenBank annotation file 
  • -o     directory for output files
  • -p1   position of origin of replication
  • -p2   position of terminus of replication
  • -n     number of CPUs to use for execution

出力例

f:id:kazumaxneo:20211007102654p:plain

 

2、欠失を計算してテーブルを出力する。0.75程度のessentiality thresholdを推奨する。必須遺伝子周辺の非コードマージンはデフォルトで200bpだが、より短い/長いシス制御要素がある場合は、この設定を変更することができる。

deleat define-deletions -g1 modified1_GenBank_file -o outdir_step2 -l 200 -e 0.75 -m <non-coding margin>

出力例

f:id:kazumaxneo:20211007102854p:plain

proposed_deletions.csv

f:id:kazumaxneo:20211007102835p:plain

 

3、ステップ2の出力テーブルを必要に応じて編集し、欠失リストを手動で管理する。2の出力を指定する。

deleat revise-deletions -g2 modified2_GenBank_file -t <modified table of proposed deletions> -o outdir_step3

出力例

f:id:kazumaxneo:20211007102957p:plain

 

4、欠失デザインとゲノム縮小プロセスに関する最終レポートを作成する。3の出力を指定する。

deleat summarise -g3 <modified-II GenBank file> -o outdir_step4 [-p1 <ori>] [-p2 <ter>] 。

出力例

f:id:kazumaxneo:20211007103115p:plain

genome_reduction.png

f:id:kazumaxneo:20211007103135p:plain

 

5、メガプライミングによる大規模ゲノム欠失のためのプライマーを設計する(Github参照)。

 

引用

DELEAT: gene essentiality prediction and deletion design for bacterial genome reduction
Jimena Solana, Emilio Garrote-Sánchez & Rosario Gil 
BMC Bioinformatics volume 22, Article number: 444 (2021)

 

関連