macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

断片化したメタゲノムアセンブリからバクテリオファージゲノムを同定する Phables

2023/09/29 論文引用

 

 ヒトの腸内に見られる微生物群集は、ヒトの健康に強い影響を及ぼす。腸内細菌やウイルスは、炎症性腸疾患などの消化器疾患に影響を及ぼす。バクテリオファージとして知られる細菌に感染するウイルスは、ヒト腸内の細菌群集を調節する上で重要な役割を果たしている。しかし、新規バクテリオファージの同定と特性解析は依然として難題である。利用可能なツールは、配列間の類似性、ヌクレオチド組成、ウイルス遺伝子/タンパク質の存在を利用している。利用可能なツールのほとんどは、個々のコンティグがウイルス由来であるかどうかを判断する。ウイルスアセンブリにおける課題から、ウイルスゲノムの断片化が起こり、ウイルス同定における新たなアプローチの必要性につながっている。

 本著者らは、断片化したウイルスのメタゲノムアセンブリからバクテリオファージゲノムを同定するための新しい計算手法であるPhablesを紹介する。Phablesは、アセンブリグラフからバクテリオファージのような構成要素を特定し、各構成要素をフローネットワークとしてモデル化し、グラフアルゴリズムとフロー分解技術を用いてゲノムパスを特定する。さまざまな環境から得られたウイルスメタゲノミックサンプルの実験結果から、Phablesによって分解されたバクテリオファージゲノムの80%以上が高品質であり、既存のウイルス同定ツールによって同定された個々のコンティグよりも長いことが示された。PhablesはGitHubhttps://github.com/Vini2/phablesで利用できる。
 

 

インストール

Github

#conda(link)
mamba create -n phables -c conda-forge -c anaconda -c bioconda phables
conda activate phables

#pip(pypi)
pip install phables

#線形計画法ソルバー Gurobiも必要
#conda
mamba install -c gurobi gurobi -y
#pip
pip install gurobipy

> phables run -h

Usage: phables run [OPTIONS] [SNAKE_ARGS]...

 

  Run Phables

 

Options:

  --input PATH                  Path to assembly graph file in .GFA format

                                [required]

  --reads PATH                  Path to directory containing paired-end reads

                                [required]

  --minlength INTEGER           minimum length of circular unitigs to consider

                                [default: 2000]

  --mincov INTEGER              minimum coverage of paths to output  [default:

                                10]

  --compcount INTEGER           maximum unitig count to consider a component

                                [default: 200]

  --maxpaths INTEGER            maximum number of paths to resolve for a

                                component  [default: 10]

  --mgfrac FLOAT                length threshold to consider single copy

                                marker genes  [default: 0.2]

  --evalue FLOAT                maximum e-value for phrog annotations

                                [default: 1e-10]

  --seqidentity FLOAT           minimum sequence identity for phrog

                                annotations  [default: 0.3]

  --covtol INTEGER              coverage tolerance for extending subpaths

                                [default: 100]

  --alpha FLOAT                 coverage multipler for flow interval modelling

                                [default: 1.2]

  --output PATH                 Output directory  [default: phables.out]

  --configfile TEXT             Custom config file [default:

                                (outputDir)/config.yaml]

  --threads INTEGER             Number of threads to use  [default: 1]

  --use-conda / --no-use-conda  Use conda for Snakemake rules  [default: use-

                                conda]

  --conda-prefix PATH           Custom conda env directory

  --snake-default TEXT          Customise Snakemake runtime args  [default:

                                --rerun-incomplete, --printshellcmds,

                                --nolock, --show-failed-logs]

  -h, --help                    Show this message and exit.

 

 

  For more information on Phables please visit:

  https://phables.readthedocs.io/

 

 

  CLUSTER EXECUTION:

  phables run ... --profile [profile]

  For information on Snakemake profiles see:

  https://snakemake.readthedocs.io/en/stable/executing/cli.html#profiles

 

  RUN EXAMPLES:

  Required:           phables run --input [assembly graph file]

  Specify threads:    phables run ... --threads [threads]

  Disable conda:      phables run ... --no-use-conda

  Change defaults:    phables run ... --snake-default="-k --nolock"

  Add Snakemake args: phables run ... --dry-run --keep-going --touch

  Specify targets:    phables run ... print_stages

  Available targets:

      all             Run everything (default)

      preprocess      Run preprocessing only

      phables         Run phables (and preprocessing if needed)

      print_stages    List available stages

> phables install -h

Usage: phables install [OPTIONS] [SNAKE_ARGS]...

 

  Install databases

 

Options:

  --output PATH                 Output directory  [default: phables.out]

  --configfile TEXT             Custom config file [default:

                                (outputDir)/config.yaml]

  --threads INTEGER             Number of threads to use  [default: 1]

  --use-conda / --no-use-conda  Use conda for Snakemake rules  [default: use-

                                conda]

  --conda-prefix PATH           Custom conda env directory

  --snake-default TEXT          Customise Snakemake runtime args  [default:

                                --rerun-incomplete, --printshellcmds,

                                --nolock, --show-failed-logs]

  -h, --help                    Show this message and exit.

 

 

  For more information on Phables please visit:

  https://phables.readthedocs.io/

 

 

  CLUSTER EXECUTION:

  phables run ... --profile [profile]

  For information on Snakemake profiles see:

  https://snakemake.readthedocs.io/en/stable/executing/cli.html#profiles

 

  RUN EXAMPLES:

  Required:           phables run --input [assembly graph file]

  Specify threads:    phables run ... --threads [threads]

  Disable conda:      phables run ... --no-use-conda

  Change defaults:    phables run ... --snake-default="-k --nolock"

  Add Snakemake args: phables run ... --dry-run --keep-going --touch

  Specify targets:    phables run ... print_stages

  Available targets:

      all             Run everything (default)

      preprocess      Run preprocessing only

      phables         Run phables (and preprocessing if needed)

      print_stages    List available stages

> phables config -h

Usage: phables config [OPTIONS] [SNAKE_ARGS]...

 

  Copy the system default config file

 

Options:

  --output PATH                 Output directory  [default: phables.out]

  --configfile TEXT             Custom config file [default:

                                (outputDir)/config.yaml]

  --threads INTEGER             Number of threads to use  [default: 1]

  --use-conda / --no-use-conda  Use conda for Snakemake rules  [default: use-

                                conda]

  --conda-prefix PATH           Custom conda env directory

  --snake-default TEXT          Customise Snakemake runtime args  [default:

                                --rerun-incomplete, --printshellcmds,

                                --nolock, --show-failed-logs]

  -h, --help                    Show this message and exit.

> phables citation

Please cite phables in your paper using this link:

https://doi.org/10.1101/2023.04.04.535632

 

Please consider also citing these dependencies:

Snaketool:

https://doi.org/10.31219/osf.io/8w5j3

 

Snakemake:

https://doi.org/10.12688/f1000research.29032.1

 

 

データベース

phables install

 

テスト

phables test

 

 

実際のランではGFA形式のアセンブリグラフファイルとfastqのディレクトリを指定する。

phables run --input assembly_graph.gfa --reads fastq/ --threads 8
  • --input     Path to assembly graph file in .GFA format

  • --reads    Path to directory containing paired-end reads

 

引用

Phables: from fragmented assemblies to high-quality bacteriophage genomes
 Vijini Mallawaarachchi,  Michael J. Roach,  Bhavya Papudeshi,  Sarah K. Giles,  Susanna R. Grigson,  Przemyslaw Decewicz,  George Bouras,  Ryan D. Hesse,  Laura K. Inglis,  Abbey L. K. Hutton,  Elizabeth A. Dinsdale,  Robert A. Edwards

bioRxiv, Posted April 04, 2023

 

203/09/29追記

Phables: from fragmented assemblies to high-quality bacteriophage genomes 
Vijini Mallawaarachchi, Michael J Roach, Przemyslaw Decewicz, Bhavya Papudeshi, Sarah K Giles, Susanna R Grigson, George Bouras, Ryan D Hesse, Laura K Inglis, Abbey L K Hutton, Elizabeth A Dinsdale, Robert A Edwards
Bioinformatics, Published: 21 September 2023