macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ロングリードを使ってリファレンスベースのアセンブリとpolishを行う Rebaler

優先順位の高いジョブがたまっているため、お盆明けくらいまで不定期更新にします。よろしくお願いいたします。

 

Rebalerはロングリード使用してリファレンスベースのアセンブリを実行するためのプログラムである。細菌ゲノム用に作られている。

 

Method (Githubより)

f:id:kazumaxneo:20190730004510p:plain

 

詳細は論文を確認して下さい。ONTのbase caller比較のペーパー中で使用されています。

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1727-y

 

インストール

miniconda3.4.0.5環境でテストした(docker使用、ホストOS ubuntu 16.0.4)

依存

  • Rebaler runs on Python 3.4+ and uses Biopython
  • minimap2 and racon executables are available in your PATH
  • Rebaler requires Racon v1.0 or later.

本体 Github

#Bioconda(link)
conda install -c bioconda -y rebaler

#Githubから
git clone https://github.com/rrwick/Rebaler.git
cd Rebaler
python3 setup.py install

> rebaler -h

# rebaler -h

usage: rebaler [-t THREADS] [--keep] [--random] [-h] [--version] reference reads

 

Rebaler: reference-based long read assemblies of bacterial genomes

 

Positional arguments:

  reference                      FASTA file of reference assembly

  reads                          FASTA/FASTQ file of long reads

 

Optional arguments:

  -t THREADS, --threads THREADS  Number of threads to use for alignment and polishing (default: 16)

  --keep                         Do not delete temp directory of intermediate files (default: delete temp directory)

  --random                       If a part of the reference is missing, replace it with random sequence (default: leave it as the reference sequence)

 

Help:

  -h, --help                     Show this help message and exit

  --version                      Show program's version number and exit

 

 

テストラン

テンプレートのリファレンス(リファレンスゲノム、ターゲット遺伝子など)とリードを指定する。

rebaler -t 20 reference.fasta reads.fastq.gz > assembly.fasta
  •  -t     Number of threads to use for alignment and polishing (default: 16)

 

リファレンスが環状ゲノムの場合、テンプレートのfastaのヘッダーに下のような感じでcircular=trueをつけてからランする。

>chromosome length=5138942 circular=true

 

引用

Performance of neural network basecalling tools for Oxford Nanopore sequencing

Ryan R. Wick, Louise M. Judd, Kathryn E. Holt
Genome Biologyvolume 20, Article number: 129 (2019)

 

関連