macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

qrqcによるfastqのクオリティレポートの作成

qrqcは 

qrqcはリードのクオリティや配列の分布をレポートできるRのパッケージ。1000-bp以下のfastqに対応している。同様の目的で使用されるツールとしてfastqcがある。

 

 

インストール

Rにて

## try http:// if https:// URLs are not supported 
source("https://bioconductor.org/biocLite.R")
biocLite("qrqc")

http://bioconductor.org/packages/devel/bioc/html/qrqc.html

 

マニュアル

browseVignettes("qrqc")

http://127.0.0.1:20080/library/qrqc/doc/qrqc.pdf

 

 

ラン

Rにて

library(qrqc)
fq <- readSeqFile("input.fastq")#10%ランダムサンプリングしてfastqを読み込み

 

読み込まれたfastqの情報を確認する。

fq

> fq

Quality Information for: input.fastq

 261774 sequences, 233067 unique with 0.10 being sampled

 mean quality: 36.101300

 min sequence length: 35

 max sequence length: 301

 

レポートを出力。

makeReport(fq)

フォルダにhtmlのレポートファイルが出力される。 

 

f:id:kazumaxneo:20170828213815j:plain

f:id:kazumaxneo:20170828213823j:plain

f:id:kazumaxneo:20170828213820j:plain

f:id:kazumaxneo:20170828213833j:plain

f:id:kazumaxneo:20170828213840j:plain

f:id:kazumaxneo:20170828213846j:plain

TruseqのNNN..配列が残存している。

 

 

 

k-mer分布。

kmerKLPlot(fq)

f:id:kazumaxneo:20170828214631j:plain

 

GC

gcPlot(fq) + geom_hline(yintercept=0.5, color="purple") 

f:id:kazumaxneo:20170828215149j:plain 

 

 

 

 

 

 

引用

 

bioinformatics

qrqc | FASTQ のクオリティチェック