macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

aDNAのダメージパターンを高速計算する DamageProfiler

 

 古代のDNA研究では、特定の特徴に基づいて古代のサンプルを認証することが、データ解析の重要なステップとなっている。このような重要性から、深いプログラミング知識を持たない研究者でも、基本的な損傷認証分析を実行できる必要がある。このようなソフトウェアは、ユーザーフレンドリーで、解析パイプラインに簡単に統合できるものでなければならない。
 DamageProfilerは、古代DNAの損傷パターンを判定するための、Javaベースのスタンドアローンソフトウェアである。結果はさまざまなファイル形式とプロットで提供され、さらなる処理が可能になっている。DamageProfilerは、直感的なグラフィカルインターフェイスコマンドラインインターフェイスを備えており、解析パイプラインに簡単に組み込むことができる。すべてのソースコードは、GitHub (https://github.com/Integrative-Transcriptomics/DamageProfiler) で自由に入手できる。

 

wiki

https://damageprofiler.readthedocs.io/en/latest/

 

インストール

依存

  • can thus be installed and run on Linux, Windows and MacOS. A Java 8+ platform has to be installed on the workstation used for running the tool.

GIthub

#bioconda (link)
mamba install -c bioconda damageprofiler -y

damageprofiler -h

$ damageprofiler -h

usage: User option parser

 -h,--help

 show this help page

 -i,--input <INPUT>

 The input sam/bam file

 -l,--length <LENGTH>

 Number of bases which are considered for frequency computations.

 -merged,--all_mapped_and_merged_reads

 Use all mapped and merged reads to calculate damage plot instead of using

 all mapped reads. The SAM/BAM entry must start with 'M_', otherwise  it

 will be skipped. Default: false

 -o,--output <OUTPUT>

 The output folder

 -r,--reference <REFERENCE>

 The reference file

 -s,--specie <SPECIE>

 RNAME flag SAM record (Reference sequence name)

 -sf,--specieslist file <SPECIES LIST>

 List with species for which damage profile has to be calculated.

 -t,--threshold <THRESHOLD>

 Number of bases which are considered for plotting nucleotide

 misincorporations

 -title,--title <TITLE>

 Title used for all plots. Default: filepath of input SAM/BAM file.

 -useall,--use_all_reads

 Use all reads (mapped and unmapped) to calculate damage plot. Default:

 false

 -version,--version

 Show version of DamageProfiler

 -xaxis_histo_id_max,--xaxis_histo_id_max <XAXIS_HISTO_ID_MAX>

 Maximal value x-axis of identity histogram.

 -xaxis_histo_id_min,--xaxis_histo_id_min <XAXIS_HISTO_ID_MIN>

 Minimal value x-axis of identity histogram.

 -xaxis_histo_length_max,--xaxis_histo_length_max <XAXIS_HISTO_LENGTH_MAX>

 Maximal value x-axis of length histogram.

 -xaxis_histo_length_min,--xaxis_histo_length_min <XAXIS_HISTO_LENGTH_MIN>

 Minimal value x-axis of length histogram.

 -yaxis_damageplot,--yaxis_damageplot <YAXIS_DAMAGEPLOT>

 Maximal value on y axis of damage plot.

 

 

実行方法

aDNAサンプルのbamファイルとbamのリファレンスfastaを指定する。

damageprofiler -i input.bam -r ref.fasta -o output_folder 
  • -i   The input sam/bam file

 

GUIモード

damageprofiler

f:id:kazumaxneo:20210530230553p:plain

bam、ref.fasta、出力ディレクトリのパスを指定してRunボタンで実行。
 

出力ディレクト

f:id:kazumaxneo:20210530230915p:plain

aDNAのfastqは持っていないので、普通のサンプルでランした結果になります。

 

引用

DamageProfiler: Fast damage pattern calculation for ancient DNA
Judith Neukamm, Alexander Peltzer, Kay Nieselt
Bioinformatics, Published: 23 April 2021

 

関連