qrqcは
qrqcはリードのクオリティや配列の分布をレポートできるRのパッケージ。1000-bp以下のfastqに対応している。同様の目的で使用されるツールとしてfastqcがある。
インストール
Rにて
## try http:// if https:// URLs are not supported
source("https://bioconductor.org/biocLite.R")
biocLite("qrqc")
http://bioconductor.org/packages/devel/bioc/html/qrqc.html
マニュアル
browseVignettes("qrqc")
http://127.0.0.1:20080/library/qrqc/doc/qrqc.pdf
ラン
Rにて
library(qrqc)
fq <- readSeqFile("input.fastq")#10%ランダムサンプリングしてfastqを読み込み
読み込まれたfastqの情報を確認する。
fq
> fq
Quality Information for: input.fastq
261774 sequences, 233067 unique with 0.10 being sampled
mean quality: 36.101300
min sequence length: 35
max sequence length: 301
レポートを出力。
makeReport(fq)
フォルダにhtmlのレポートファイルが出力される。
TruseqのNNN..配列が残存している。
k-mer分布。
kmerKLPlot(fq)
gcPlot(fq) + geom_hline(yintercept=0.5, color="purple")
引用