macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ロングリードを完全長ゲノムアセンブリの難しい領域へ正確にマッピングする VerityMap

 

 最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間(完全)アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、完全長アセンブリにおけるリードマッピングのために、正確で、エラーの顕在化(潜在的アセンブリエラーの検出)ができ、2倍体を認識する(異なるハプロタイプを区別する)ツールを開発する必要がある。本著者らは、完全長アセンブリへのロングリードマッピングのため正確でエラーを検出し、部分的にディプロイドを認識するはじめてのツールであるVerityMapについて述べる。

 

インストール

condaで環境を作って導入した(ubuntu22.04LTS)。

Github

mamba create -n VerityMap python=3 -y
conda activate VerityMap
git clone https://github.com/ablab/VerityMap.git
cd VerityMap/
pip install -r requirements.txt
python3 setup.py install

#docker image(hub)
docker run -it mobinasri/veritymap:latest
cd /home/apps/VerityMap-2.1.1-alpha/
python3 setup.py install

$ veritymap  --help

Usage: veritymap [OPTIONS] [ASSEMBLY_FNAMES]...

 

Options:

  --reads PATH                    File with ONT/PacBio reads

  -o PATH                         Output folder  [required]

  -t INTEGER                      Threads

  -d [hifi-haploid|hifi-haploid-complete|hifi-diploid|ont-haploid-complete]

                                  Sequencing platform, supported types are:

                                  "hifi" for PacBio HiFi reads and "ont" for

                                  ONT reads.Please note that "ont" mode is

                                  experimental and should be used with extra

                                  care

  -f, --no-reuse                  Do not reuse old files

  --careful                       Run mapper in a careful mode to better

                                  detect inconsistencies. Can be time- and

                                  memory-consuming. Not recommended to run on

                                  the whole genome.

  -l TEXT                         Comma separated list of assembly labels

  --help                          Show this message and exit.

 

 

テストラン

cd VerityMap/
veritymap --reads veritymap/test_dataset/test_query.fasta veritymap/test_dataset/test_target.fasta -o test_outdir -d hifi-haploid

ラン中にエラーが出て解決できなかった。

 

引用

Fast and accurate mapping of long reads to complete genome assemblies with VerityMap
Andrey V Bzikadze, Alla Mikheenko, Pavel A Pevzner

Genome Res. 2022 Nov-Dec;32(11-12):2107–2118.