優先順位の高いジョブがたまっているため、お盆明けくらいまで不定期更新にします。よろしくお願いいたします。
Rebalerはロングリード使用してリファレンスベースのアセンブリを実行するためのプログラムである。細菌ゲノム用に作られている。
Method (Githubより)
詳細は論文を確認して下さい。ONTのbase caller比較のペーパー中で使用されています。
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1727-y
インストール
miniconda3.4.0.5環境でテストした(docker使用、ホストOS ubuntu 16.0.4)
依存
- Rebaler runs on Python 3.4+ and uses Biopython
- minimap2 and racon executables are available in your PATH
- Rebaler requires Racon v1.0 or later.
本体 Github
#Bioconda(link)
conda install -c bioconda -y rebaler
#Githubから
git clone https://github.com/rrwick/Rebaler.git
cd Rebaler
python3 setup.py install
> rebaler -h
# rebaler -h
usage: rebaler [-t THREADS] [--keep] [--random] [-h] [--version] reference reads
Rebaler: reference-based long read assemblies of bacterial genomes
Positional arguments:
reference FASTA file of reference assembly
reads FASTA/FASTQ file of long reads
Optional arguments:
-t THREADS, --threads THREADS Number of threads to use for alignment and polishing (default: 16)
--keep Do not delete temp directory of intermediate files (default: delete temp directory)
--random If a part of the reference is missing, replace it with random sequence (default: leave it as the reference sequence)
Help:
-h, --help Show this help message and exit
--version Show program's version number and exit
テストラン
テンプレートのリファレンス(リファレンスゲノム、ターゲット遺伝子など)とリードを指定する。
rebaler -t 20 reference.fasta reads.fastq.gz > assembly.fasta
- -t Number of threads to use for alignment and polishing (default: 16)
リファレンスが環状ゲノムの場合、テンプレートのfastaのヘッダーに下のような感じでcircular=trueをつけてからランする。
>chromosome length=5138942 circular=true
引用
Performance of neural network basecalling tools for Oxford Nanopore sequencing
Ryan R. Wick, Louise M. Judd, Kathryn E. Holt
Genome Biologyvolume 20, Article number: 129 (2019)
関連