macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

VITAP

 

 新たに同定されたDNAおよびRNAウイルス配列の数が急速に増加していることから、すべてのウイルス領域をさまざまな分類レベルで正確かつ包括的に分類するシステムの必要性が浮き彫りになっている。VITAPは、アライメントに基づく技術とグラフを統合することにより、DNAおよびRNAウイルス配列を高精度に分類し、各分類単位の信頼度を提供する。このツールは、International Committee on Taxonomy of Viruses (ICTV)からの最新のリファレンスと同期してデータベースを自動的に更新し、1,000塩基対という短いウイルス配列を属レベルまで効率的に分類する。VITAPは優れた能力を持ち、他のパイプラインに匹敵する精度を維持しながら、ほとんどのDNAおよびRNAウイルス系統でより高いアノテーション率を達成している。深海のviromeにおけるVITAPの応用は、深海のウイルスの包括的な多様性情報を提供し、重要な分類学的更新につながっている。VITAPはhttps://github.com/DrKaiyangZheng/VITAPで利用できる。

 

インストール

Github

git clone https://github.com/DrKaiyangZheng/VITAP.git
cd VITAP
mamba env create -f VITAP_conda_environment_Linux.yaml -n VITAP
conda activate VITAP
cd scripts/
chmod +x ./*
export PATH=$(pwd)/:$PATH #パスを通す

#or conda
mamba install bioconda::vitap -y

> ./VITAP -h

*******************************************************************

The VITAP (Viral Taxonomic Assignment Pipeline) v.1.3, Copyright 2024 Kaiyang Zheng, Viral/microbial diversity Lab. Ocean University of China

*******************************************************************

Usage: ./VITAP <command> [options]

Commands:

  assignment    VITAP taxonomic assignment pipeline.

  upd           Update program of VITAP. The VITAP will update database based on ICTV VMR or other formated source.

 

For command-specific help, run: ./VITAP <command> -h

 

> ./VITAP assignment -h

usage: VITAP_assignment_20241007.py [-h] -i FASTA -d DB [-p CPU] -o OUT [--low_conf]

 

The VITAP (Viral Taxonomic Assignment Pipeline, main program) v.1.5, Copyright 2024 Kaiyang Zheng, Viral/microbial diversity Lab. Ocean University of China

 

options:

  -h, --help            show this help message and exit

  -i FASTA, --fasta FASTA

                        Input genome sequence file in FASTA format.

  -d DB, --db DB        VITAP database folder, which contains 10 required files: VMR genome mapping csv file, VMR protein DIAMOND database, eight lineage weight files (Species/Genus/Family/Order/Class/Phylum/Kingdom/Realm).

  -p CPU, --cpu CPU     Number of threads available for DIAMOND

  -o OUT, --out OUT     Result folder name

  --low_conf            Exporting taxonomic assignments with low confidence, which will be discarded by default [lineage score < 0.1].

 

*******************************************************************

Example usage: VITAP assignment -i target_genome.fasta -d ./DB_20230510/ -o VITAP_result

*******************************************************************

 

> ./VITAP upd -h

usage: VITAP_upd_20241007.py [-h] --vmr VMR -o OUT -d DB

 

The VITAP (Viral Taxonomic Assignment Pipeline, update program) v.1.5, Copyright 2024 Kaiyang Zheng, Viral/microbial diversity Lab. Ocean University of China

 

options:

  -h, --help         show this help message and exit

  --vmr VMR          Input raw ICTV VMR source file in csv format.

  -o OUT, --out OUT  Reformat ICTV VMR source file for VITAP utilization

  -d DB, --db DB     You need to assign a name for a new DB

 

*******************************************************************

Example usage: VITAP upd --vmr raw_VMR.csv -o VMR_reformat.csv -d VMR-MSL

*******************************************************************

 

 

 

データベース

Pre-build DBがhttps://doi.org/10.6084/m9.figshare.25426159.v3で公開されている。

ダウンロードして解凍する。

ls -alth 25426159/

 

テストラン

リードを指定する。

cd VITAP/test/
VITAP assignment -i toy_set.fasta -d ./DB_MSL-demo/ -o outdir

 

 

引用

VITAP: a high precision tool for DNA and RNA viral classification based on meta-omic data

Kaiyang Zheng, Jianhua Sun, Yantao Liang, Liangliang Kong, David Paez-Espino, Andrew Mcminn & Min Wang 

Nature Communications volume 16, Article number: 2226 (2025)