macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

krakenの出力をMultiQCで分析する

 

MultiQCはkraken1と2のレポート出力の分析にも対応している。使用するには--reportをつけてkrakenを実行し、レポートファイルを作成しておく。

 

対応しているツール一覧

https://multiqc.info/modules/

kraken1とkraken2への対応

https://multiqc.info/modules/kraken/

 

1、kraken2(Github)の実行

$fastq1=SRRxxxxxxxx_1.fastq.gz
$fastq2=SRRxxxxxxxx_2.fastq.gz
$name=SRRxxxxxxxx

kraken2 --db kraken2-database --threads 20 --paired --report kraken2_report.txt --gzip-compressed --classified-out seqs#.fq $fastq1 $fastq2 > ${name}_output.txt
  • --report     Print a report with aggregrate counts/clade to file
  • --gzip-compressed     Input files are compressed with gzip
  • --classified-out    Print classified sequences to filename

出力されるreportファイル例

--classified-out seqs#.fqをつけておくと、分類されたfastqもseqs_1.fqとseqs_2.fqとして書き出される。

 

2、multiqcで分析する。

multiqc ./

インタラクティブなHTMLレポートとして出力される。

 

percentage表示でphylum。

 

引用

https://github.com/ewels/MultiQC