2023/09/29 論文引用
ヒトの腸内に見られる微生物群集は、ヒトの健康に強い影響を及ぼす。腸内細菌やウイルスは、炎症性腸疾患などの消化器疾患に影響を及ぼす。バクテリオファージとして知られる細菌に感染するウイルスは、ヒト腸内の細菌群集を調節する上で重要な役割を果たしている。しかし、新規バクテリオファージの同定と特性解析は依然として難題である。利用可能なツールは、配列間の類似性、ヌクレオチド組成、ウイルス遺伝子/タンパク質の存在を利用している。利用可能なツールのほとんどは、個々のコンティグがウイルス由来であるかどうかを判断する。ウイルスアセンブリにおける課題から、ウイルスゲノムの断片化が起こり、ウイルス同定における新たなアプローチの必要性につながっている。
本著者らは、断片化したウイルスのメタゲノムアセンブリからバクテリオファージゲノムを同定するための新しい計算手法であるPhablesを紹介する。Phablesは、アセンブリグラフからバクテリオファージのような構成要素を特定し、各構成要素をフローネットワークとしてモデル化し、グラフアルゴリズムとフロー分解技術を用いてゲノムパスを特定する。さまざまな環境から得られたウイルスメタゲノミックサンプルの実験結果から、Phablesによって分解されたバクテリオファージゲノムの80%以上が高品質であり、既存のウイルス同定ツールによって同定された個々のコンティグよりも長いことが示された。PhablesはGitHubのhttps://github.com/Vini2/phablesで利用できる。
インストール
#conda(link)
mamba create -n phables -c conda-forge -c anaconda -c bioconda phables
conda activate phables
#pip(pypi)
pip install phables
#線形計画法ソルバー Gurobiも必要
#conda
mamba install -c gurobi gurobi -y
#pip
pip install gurobipy
> phables run -h
Usage: phables run [OPTIONS] [SNAKE_ARGS]...
Run Phables
Options:
--input PATH Path to assembly graph file in .GFA format
[required]
--reads PATH Path to directory containing paired-end reads
[required]
--minlength INTEGER minimum length of circular unitigs to consider
[default: 2000]
--mincov INTEGER minimum coverage of paths to output [default:
10]
--compcount INTEGER maximum unitig count to consider a component
[default: 200]
--maxpaths INTEGER maximum number of paths to resolve for a
component [default: 10]
--mgfrac FLOAT length threshold to consider single copy
marker genes [default: 0.2]
--evalue FLOAT maximum e-value for phrog annotations
[default: 1e-10]
--seqidentity FLOAT minimum sequence identity for phrog
annotations [default: 0.3]
--covtol INTEGER coverage tolerance for extending subpaths
[default: 100]
--alpha FLOAT coverage multipler for flow interval modelling
[default: 1.2]
--output PATH Output directory [default: phables.out]
--configfile TEXT Custom config file [default:
(outputDir)/config.yaml]
--threads INTEGER Number of threads to use [default: 1]
--use-conda / --no-use-conda Use conda for Snakemake rules [default: use-
conda]
--conda-prefix PATH Custom conda env directory
--snake-default TEXT Customise Snakemake runtime args [default:
--rerun-incomplete, --printshellcmds,
--nolock, --show-failed-logs]
-h, --help Show this message and exit.
For more information on Phables please visit:
https://phables.readthedocs.io/
CLUSTER EXECUTION:
phables run ... --profile [profile]
For information on Snakemake profiles see:
https://snakemake.readthedocs.io/en/stable/executing/cli.html#profiles
RUN EXAMPLES:
Required: phables run --input [assembly graph file]
Specify threads: phables run ... --threads [threads]
Disable conda: phables run ... --no-use-conda
Change defaults: phables run ... --snake-default="-k --nolock"
Add Snakemake args: phables run ... --dry-run --keep-going --touch
Specify targets: phables run ... print_stages
Available targets:
all Run everything (default)
preprocess Run preprocessing only
phables Run phables (and preprocessing if needed)
print_stages List available stages
> phables install -h
Usage: phables install [OPTIONS] [SNAKE_ARGS]...
Install databases
Options:
--output PATH Output directory [default: phables.out]
--configfile TEXT Custom config file [default:
(outputDir)/config.yaml]
--threads INTEGER Number of threads to use [default: 1]
--use-conda / --no-use-conda Use conda for Snakemake rules [default: use-
conda]
--conda-prefix PATH Custom conda env directory
--snake-default TEXT Customise Snakemake runtime args [default:
--rerun-incomplete, --printshellcmds,
--nolock, --show-failed-logs]
-h, --help Show this message and exit.
For more information on Phables please visit:
https://phables.readthedocs.io/
CLUSTER EXECUTION:
phables run ... --profile [profile]
For information on Snakemake profiles see:
https://snakemake.readthedocs.io/en/stable/executing/cli.html#profiles
RUN EXAMPLES:
Required: phables run --input [assembly graph file]
Specify threads: phables run ... --threads [threads]
Disable conda: phables run ... --no-use-conda
Change defaults: phables run ... --snake-default="-k --nolock"
Add Snakemake args: phables run ... --dry-run --keep-going --touch
Specify targets: phables run ... print_stages
Available targets:
all Run everything (default)
preprocess Run preprocessing only
phables Run phables (and preprocessing if needed)
print_stages List available stages
> phables config -h
Usage: phables config [OPTIONS] [SNAKE_ARGS]...
Copy the system default config file
Options:
--output PATH Output directory [default: phables.out]
--configfile TEXT Custom config file [default:
(outputDir)/config.yaml]
--threads INTEGER Number of threads to use [default: 1]
--use-conda / --no-use-conda Use conda for Snakemake rules [default: use-
conda]
--conda-prefix PATH Custom conda env directory
--snake-default TEXT Customise Snakemake runtime args [default:
--rerun-incomplete, --printshellcmds,
--nolock, --show-failed-logs]
-h, --help Show this message and exit.
> phables citation
Please cite phables in your paper using this link:
https://doi.org/10.1101/2023.04.04.535632
Please consider also citing these dependencies:
Snaketool:
https://doi.org/10.31219/osf.io/8w5j3
Snakemake:
https://doi.org/10.12688/f1000research.29032.1
データベース
phables install
テスト
phables test
実際のランではGFA形式のアセンブリグラフファイルとfastqのディレクトリを指定する。
phables run --input assembly_graph.gfa --reads fastq/ --threads 8
-
--input Path to assembly graph file in .GFA format
-
--reads Path to directory containing paired-end reads
引用
Phables: from fragmented assemblies to high-quality bacteriophage genomes
Vijini Mallawaarachchi, Michael J. Roach, Bhavya Papudeshi, Sarah K. Giles, Susanna R. Grigson, Przemyslaw Decewicz, George Bouras, Ryan D. Hesse, Laura K. Inglis, Abbey L. K. Hutton, Elizabeth A. Dinsdale, Robert A. Edwards
bioRxiv, Posted April 04, 2023
203/09/29追記
Phables: from fragmented assemblies to high-quality bacteriophage genomes
Vijini Mallawaarachchi, Michael J Roach, Przemyslaw Decewicz, Bhavya Papudeshi, Sarah K Giles, Susanna R Grigson, George Bouras, Ryan D Hesse, Laura K Inglis, Abbey L K Hutton, Elizabeth A Dinsdale, Robert A Edwards
Bioinformatics, Published: 21 September 2023