最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間(完全)アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、完全長アセンブリにおけるリードマッピングのために、正確で、エラーの顕在化(潜在的なアセンブリエラーの検出)ができ、2倍体を認識する(異なるハプロタイプを区別する)ツールを開発する必要がある。本著者らは、完全長アセンブリへのロングリードマッピングのため正確でエラーを検出し、部分的にディプロイドを認識するはじめてのツールであるVerityMapについて述べる。
インストール
condaで環境を作って導入した(ubuntu22.04LTS)。
mamba create -n VerityMap python=3 -y
conda activate VerityMap
git clone https://github.com/ablab/VerityMap.git
cd VerityMap/
pip install -r requirements.txt
python3 setup.py install
#docker image(hub)
docker run -it mobinasri/veritymap:latest
cd /home/apps/VerityMap-2.1.1-alpha/
python3 setup.py install
$ veritymap --help
Usage: veritymap [OPTIONS] [ASSEMBLY_FNAMES]...
Options:
--reads PATH File with ONT/PacBio reads
-o PATH Output folder [required]
-t INTEGER Threads
-d [hifi-haploid|hifi-haploid-complete|hifi-diploid|ont-haploid-complete]
Sequencing platform, supported types are:
"hifi" for PacBio HiFi reads and "ont" for
ONT reads.Please note that "ont" mode is
experimental and should be used with extra
care
-f, --no-reuse Do not reuse old files
--careful Run mapper in a careful mode to better
detect inconsistencies. Can be time- and
memory-consuming. Not recommended to run on
the whole genome.
-l TEXT Comma separated list of assembly labels
--help Show this message and exit.
テストラン
cd VerityMap/
veritymap --reads veritymap/test_dataset/test_query.fasta veritymap/test_dataset/test_target.fasta -o test_outdir -d hifi-haploid
ラン中にエラーが出て解決できなかった。
引用
Fast and accurate mapping of long reads to complete genome assemblies with VerityMap
Andrey V Bzikadze, Alla Mikheenko, Pavel A Pevzner
Genome Res. 2022 Nov-Dec;32(11-12):2107–2118.