バイサルフィット処理された配列をアライメントする新しいツールbwa-mesを紹介し、既存のアライナーと比較する。結果、クオリティトリミングを行わなくても、高速で正確なアライメントが可能であり。下流のツールですぐに使用できることを示す。
ターゲットシーケンスプロジェクトで得られたオンターゲットとオフターゲットのリード数を比較し、シミュレーションによって精度を評価する。また、シミュレーションにより精度を評価する。ベンチマークスクリプトとbwa-methソフトウェアは、MITライセンスの下、https://github/com/brentp/bwameth/で入手できる。
インストール
依存
- python 2.7+ (including python3)
-
samtools command on the $PATH (https://github.com/samtools/samtools)
-
bwa mem from: https://github.com/lh3/bwa
#conda (link)
mamba install -c bioconda bwameth -y
> bwameth.py
$ bwameth.py
usage:
map bisulfite converted reads to an insilico converted genome using bwa mem.
A command to this program like:
python bwameth.py --reference ref.fa A.fq B.fq
Gets converted to:
bwa mem -pCMR ref.fa.bwameth.c2t '<python bwameth.py c2t A.fq B.fq'
So that A.fq has C's converted to T's and B.fq has G's converted to A's
and both are streamed directly to the aligner without a temporary file
producing standard SAM output
[-h] --reference REFERENCE [-t THREADS] [--read-group READ_GROUP]
[--set-as-failed {f,r}] [-p] [--version]
fastqs [fastqs ...]
map bisulfite converted reads to an insilico converted genome using bwa mem.
A command to this program like:
python bwameth.py --reference ref.fa A.fq B.fq
Gets converted to:
bwa mem -pCMR ref.fa.bwameth.c2t '<python bwameth.py c2t A.fq B.fq'
So that A.fq has C's converted to T's and B.fq has G's converted to A's
and both are streamed directly to the aligner without a temporary file
producing standard SAM output
実行方法
bwa-methは、一般的なDirectionalのペアエンドリード用に設計されている。また、シングルエンドリードのアラインメントも可能。bwa-methはソフトクリッピングを使用して一致しないリード部分をマスクするため、アラインメント前のクオリティトリミングは不要とされている。
1、Indexing
bwameth.py index ref.fasta
出力
2、Mapping
bwameth.py --reference ref.fasta read_R1.fastq.gz read_R2.fastq.gz > output.sam
引用
Fast and accurate alignment of long bisulfite-seq reads
Brent S. Pedersen, Kenneth Eyring, Subhajyoti De, Ivana V. Yang, David A. Schwartz
arXiv, Submitted on 6 Jan 2014 (v1)