macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ドラフトアセンブリからプラスミドを同定する MOB-suite

 

 コストパフォーマンスの高いIllumina社のショートリードシーケンシングにより、大規模な細菌集団遺伝学研究が日常的に行われるようになった。しかし、プラスミドのアセンブリが不完全であるため、プラスミドの含有量を分析することは依然として困難である。細菌の分離株にはいくつものプラスミドが含まれている可能性があるが、repetitive elementsが存在するため、アセンブリは複雑なままである。プラスミドを解析するためのツールは数多く開発されているが、ツールの性能や機能は様々である。MOB-suiteは、プラスミドの特性評価を容易にするために、ドラフトアセンブリデータからプラスミドを再構築し、タイピングするためのモジュール式ツールのセットとして開発された。公開されているIlluminaデータのクローズドゲノムセットを用いて、MOB-suiteはプラスミド由来のコンティグを高い感度と特異性で同定した(それぞれ95%と88%)。一方、plasmidfinderは、高い特異性(99%)を示したが、感度は50%にとどまった。377個の既知のプラスミドからなる同じデータセットを用いて、MOB-reconは207個のプラスミドを正確に再構築し、他のプラスミドや染色体の配列を含まない単一のグループに割り当てることができたが、plasmidSPAdesは102個のプラスミドしか正確に再構築できなかった。一般的に、plasmidSPAdesは異なるプラスミドをマージする傾向があり、208個のプラスミドがマージイベントを受けた。MOB-suiteでは、エラーの数は減ったが、84個のプラスミドが分裂と合併の両方を起こし、より多くのハイブリッドプラスミドが生成された。また、MOB-suiteはplasmidfinderと同様にレプリコン・タイピングを行うが、リラクサーゼ・タイピングとコンジュゲーション・ポテンシャルの予測も含まれている。MOB-suite は Python 3 で書かれており、https://github.com/phac-nml/mob-suite から入手できる。

 

インストール

オーサーらが公開しているdocker imageをpullしてテストした。

Requires

  • Python >= 3.7
  • ete3 >= 3.1.2
  • pandas >=0.22.0,<=1.05
  • biopython >= 1.70
  • pytables >= 3.3
  • pycurl >= 7.43
  • pyqt >= 5
  • numpy >= 1.18.1
  • scipy >= 1.4.1

Dependencies

  • blast+ v. 2.3.0
  • mash

Github

#conda
mamba create -n mobsuite -y python=3
conda activate mobsuite 
mamba install -c bioconda mob_suite -y

#pip
pip3 install mob_suite

#docker
docker pull kbessonov/mob_suite:3.0.1

 

 

実行方法

Single plasmid

mob_typer --infile assembly.fasta --out_file sample_mobtyper_results.txt

 

Multiple independant plasmids

mob_typer --multi --infile assembly.fasta --out_file sample_mobtyper_results.txt

 

プラスミドを13個持つ大腸菌ゲノムアセンブリを使ってみた。

docker run --rm -v $(pwd):/mnt/ "kbessonov/mob_suite:3.0.1" mob_recon -i /mnt/GCF_014522225.1_ASM1452222v1_genomic.fna -t -o /mnt/output

出力

f:id:kazumaxneo:20210414131741p:plain

contig_report.txt

f:id:kazumaxneo:20210414132036p:plain

 

 

引用

MOB-suite: software tools for clustering, reconstruction and typing of plasmids from draft assemblies

James Robertson, John H E Nash

Microb Genom. 2018 Aug;4(8)

 

 


Universal whole-sequence-based plasmid typing and its utility to prediction of host range and epidemiological surveillance

James Robertson, Kyrylo Bessonov, Justin Schonfeld , John H E Nash

Microb Genom. 2020 Oct;6(10)

 

関連