コストパフォーマンスの高いIllumina社のショートリードシーケンシングにより、大規模な細菌集団遺伝学研究が日常的に行われるようになった。しかし、プラスミドのアセンブリが不完全であるため、プラスミドの含有量を分析することは依然として困難である。細菌の分離株にはいくつものプラスミドが含まれている可能性があるが、repetitive elementsが存在するため、アセンブリは複雑なままである。プラスミドを解析するためのツールは数多く開発されているが、ツールの性能や機能は様々である。MOB-suiteは、プラスミドの特性評価を容易にするために、ドラフトアセンブリデータからプラスミドを再構築し、タイピングするためのモジュール式ツールのセットとして開発された。公開されているIlluminaデータのクローズドゲノムセットを用いて、MOB-suiteはプラスミド由来のコンティグを高い感度と特異性で同定した(それぞれ95%と88%)。一方、plasmidfinderは、高い特異性(99%)を示したが、感度は50%にとどまった。377個の既知のプラスミドからなる同じデータセットを用いて、MOB-reconは207個のプラスミドを正確に再構築し、他のプラスミドや染色体の配列を含まない単一のグループに割り当てることができたが、plasmidSPAdesは102個のプラスミドしか正確に再構築できなかった。一般的に、plasmidSPAdesは異なるプラスミドをマージする傾向があり、208個のプラスミドがマージイベントを受けた。MOB-suiteでは、エラーの数は減ったが、84個のプラスミドが分裂と合併の両方を起こし、より多くのハイブリッドプラスミドが生成された。また、MOB-suiteはplasmidfinderと同様にレプリコン・タイピングを行うが、リラクサーゼ・タイピングとコンジュゲーション・ポテンシャルの予測も含まれている。MOB-suite は Python 3 で書かれており、https://github.com/phac-nml/mob-suite から入手できる。
インストール
オーサーらが公開しているdocker imageをpullしてテストした。
Requires
- Python >= 3.7
- ete3 >= 3.1.2
- pandas >=0.22.0,<=1.05
- biopython >= 1.70
- pytables >= 3.3
- pycurl >= 7.43
- pyqt >= 5
- numpy >= 1.18.1
- scipy >= 1.4.1
Dependencies
- blast+ v. 2.3.0
- mash
#conda
mamba create -n mobsuite -y python=3
conda activate mobsuite
mamba install -c bioconda mob_suite -y
#pip
pip3 install mob_suite
#docker
docker pull kbessonov/mob_suite:3.0.1
実行方法
Single plasmid
mob_typer --infile assembly.fasta --out_file sample_mobtyper_results.txt
Multiple independant plasmids
mob_typer --multi --infile assembly.fasta --out_file sample_mobtyper_results.txt
docker run --rm -v $(pwd):/mnt/ "kbessonov/mob_suite:3.0.1" mob_recon -i /mnt/GCF_014522225.1_ASM1452222v1_genomic.fna -t -o /mnt/output
出力
contig_report.txt
引用
MOB-suite: software tools for clustering, reconstruction and typing of plasmids from draft assemblies
James Robertson, John H E Nash
Microb Genom. 2018 Aug;4(8)
Universal whole-sequence-based plasmid typing and its utility to prediction of host range and epidemiological surveillance
James Robertson, Kyrylo Bessonov, Justin Schonfeld , John H E Nash
Microb Genom. 2020 Oct;6(10)
関連