macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

DNAでもRNAでも使える、複数サンプルのマッピングを同時比較できるGUIツール Qualimap2

 2019 9/8 インストール追記

  

公式サイト

http://qualimap.bioinfo.cipf.es

ユーザーマニュアル

http://qualimap.bioinfo.cipf.es/doc_html/index.html

ワークフロー

http://qualimap.bioinfo.cipf.es/doc_html/workflow.html

CUI環境でのラン。

http://qualimap.bioinfo.cipf.es/doc_html/command_line.html

 

インストール

依存

  • Picard:  a Java API (SAM-JDK) for creating programs that read and write SAM files.
  • FastQC:  a quality control tool for high throughput sequence data.
  • SAMTools:  essential utilities for manipulating alignments in the SAM format.
  • NOISeq (リンク) quality control and differential gene expression analysis for RNA-seq data. 
  • Repitools (リンク)quality assessment, visualization, summarization and statistical analysis of epigenomics experiments. 

 

公式サイトからダウンロードしてフォルダにパスを通す。

#解凍して中に入り、次のように打つ。
echo export PATH=\$PATH:`pwd`\ >> ~/.bash_profile && source ~/.bash_profile

#またはcondaを使う、ここではcondaの仮想環境に導入。
#biocona (link)
conda create -n qualimap-env -y qualimap
conda activate qualimap-env

> qualimap -h

$ qualimap -h

Java memory size is set to 1200M

Launching application...

 

Java HotSpot(TM) 64-Bit Server VM warning: ignoring option MaxPermSize=1024m; support was removed in 8.0

QualiMap v.2.2.1

Built on 2016-10-03 18:14

 

usage: qualimap <tool> [options]

 

To launch GUI leave <tool> empty.

 

Available tools:

 

    bamqc            Evaluate NGS mapping to a reference genome

    rnaseq           Evaluate RNA-seq alignment data

    counts           Counts data analysis (further RNA-seq data evaluation)

    multi-bamqc      Compare QC reports from multiple NGS mappings

    clustering       Cluster epigenomic signals

    comp-counts      Compute feature counts

 

Special arguments: 

 

    --java-mem-size  Use this argument to set Java memory heap size. Example:

                     qualimap bamqc -bam very_large_alignment.bam --java-mem-size=4G

 

 

ラン

qualimap --java-mem-size=4G #GUI版が開く

 

File -> New analysis -> BAM QCを選択。

f:id:kazumaxneo:20180119012031j:plain

 

BAMファイルを選択(SAMも可能だがposition sort されている必要がある)。

f:id:kazumaxneo:20180119012147j:plain

>>> Start analysisをクリックして解析開始。

 

マッピングの詳細。

f:id:kazumaxneo:20180119012350j:plain

 

coverage

f:id:kazumaxneo:20180119012446j:plain

 

coverage histgram

f:id:kazumaxneo:20180119012518j:plain

 

duplication率

f:id:kazumaxneo:20180119012640j:plain

 

リードのポジション毎の塩基の分布

f:id:kazumaxneo:20180119012657j:plain

 

GC率の分布

f:id:kazumaxneo:20180119012711j:plain

 

リードのポジション毎のクリッピング

f:id:kazumaxneo:20180119012732j:plain

 

Homo polymer

f:id:kazumaxneo:20180119012933j:plain

 

Mapping quality

f:id:kazumaxneo:20180119012952j:plain

 

Mapping qualityのヒストグラム

f:id:kazumaxneo:20180119013043j:plain

 

インサートサイズ

f:id:kazumaxneo:20180119013128j:plain

 

インサートサイズの分布

f:id:kazumaxneo:20180119013101j:plain

 

結果はexport as PDFまたはHTMLから画像出力できる。

f:id:kazumaxneo:20180119013307j:plain 

 

 

 

複数sampleを比較するなら、Multi-sample BAM QCから開始する。PCA plotなどが追加される。データも重ねて表示される(12sample例)。

f:id:kazumaxneo:20180119015611j:plain

 

リンク先から色々なデータを確認できます。

http://qualimap.bioinfo.cipf.es/doc_html/samples.html

 

 

引用

Qualimap 2: advanced multi-sample quality control for high-throughput sequencing data.

Okonechnikov K, Conesa A, García-Alcalde F.

Bioinformatics. 2016 Jan 15;32(2):292-4.

 

Qualimap: evaluating next-generation sequencing alignment data.

García-Alcalde F1, Okonechnikov K, Carbonell J, Cruz LM, Götz S, Tarazona S, Dopazo J, Meyer TF, Conesa A.

Bioinformatics. 2012 Oct 15;28(20):2678-9.