macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

バイサルファイト処理されたリードのマッピングを行う bwa-meth

 

 バイサルフィット処理された配列をアライメントする新しいツールbwa-mesを紹介し、既存のアライナーと比較する。結果、クオリティトリミングを行わなくても、高速で正確なアライメントが可能であり。下流のツールですぐに使用できることを示す。
ターゲットシーケンスプロジェクトで得られたオンターゲットとオフターゲットのリード数を比較し、シミュレーションによって精度を評価する。また、シミュレーションにより精度を評価する。ベンチマークスクリプトとbwa-methソフトウェアは、MITライセンスの下、https://github/com/brentp/bwameth/で入手できる。

 

インストール

依存

Github

#conda (link)
mamba install -c bioconda bwameth -y

> bwameth.py

$ bwameth.py 

usage: 

map bisulfite converted reads to an insilico converted genome using bwa mem.

A command to this program like:

 

python bwameth.py --reference ref.fa A.fq B.fq

 

Gets converted to:

 

bwa mem -pCMR ref.fa.bwameth.c2t '<python bwameth.py c2t A.fq B.fq'

 

So that A.fq has C's converted to T's and B.fq has G's converted to A's

and both are streamed directly to the aligner without a temporary file

producing standard SAM output

 

[-h] --reference REFERENCE [-t THREADS] [--read-group READ_GROUP]

[--set-as-failed {f,r}] [-p] [--version]

fastqs [fastqs ...]

 

map bisulfite converted reads to an insilico converted genome using bwa mem.

A command to this program like:

 

python bwameth.py --reference ref.fa A.fq B.fq

 

Gets converted to:

 

bwa mem -pCMR ref.fa.bwameth.c2t '<python bwameth.py c2t A.fq B.fq'

 

So that A.fq has C's converted to T's and B.fq has G's converted to A's

and both are streamed directly to the aligner without a temporary file

producing standard SAM output

 

 

実行方法

bwa-methは、一般的なDirectionalのペアエンドリード用に設計されている。また、シングルエンドリードのアラインメントも可能。bwa-methはソフトクリッピングを使用して一致しないリード部分をマスクするため、アラインメント前のクオリティトリミングは不要とされている。

 

1、Indexing

bwameth.py index ref.fasta

 出力

f:id:kazumaxneo:20210813125330p:plain

 

2、Mapping

bwameth.py --reference ref.fasta read_R1.fastq.gz read_R2.fastq.gz > output.sam

 

 

引用

Fast and accurate alignment of long bisulfite-seq reads
Brent S. Pedersen, Kenneth Eyring, Subhajyoti De, Ivana V. Yang, David A. Schwartz
arXiv, Submitted on 6 Jan 2014 (v1)