古代のDNA研究では、特定の特徴に基づいて古代のサンプルを認証することが、データ解析の重要なステップとなっている。このような重要性から、深いプログラミング知識を持たない研究者でも、基本的な損傷認証分析を実行できる必要がある。このようなソフトウェアは、ユーザーフレンドリーで、解析パイプラインに簡単に統合できるものでなければならない。
DamageProfilerは、古代DNAの損傷パターンを判定するための、Javaベースのスタンドアローンソフトウェアである。結果はさまざまなファイル形式とプロットで提供され、さらなる処理が可能になっている。DamageProfilerは、直感的なグラフィカルインターフェイスとコマンドラインインターフェイスを備えており、解析パイプラインに簡単に組み込むことができる。すべてのソースコードは、GitHub (https://github.com/Integrative-Transcriptomics/DamageProfiler) で自由に入手できる。
https://damageprofiler.readthedocs.io/en/latest/
インストール
依存
- can thus be installed and run on Linux, Windows and MacOS. A Java 8+ platform has to be installed on the workstation used for running the tool.
#bioconda (link)
mamba install -c bioconda damageprofiler -y
> damageprofiler -h
$ damageprofiler -h
usage: User option parser
-h,--help
show this help page
-i,--input <INPUT>
The input sam/bam file
-l,--length <LENGTH>
Number of bases which are considered for frequency computations.
-merged,--all_mapped_and_merged_reads
Use all mapped and merged reads to calculate damage plot instead of using
all mapped reads. The SAM/BAM entry must start with 'M_', otherwise it
will be skipped. Default: false
-o,--output <OUTPUT>
The output folder
-r,--reference <REFERENCE>
The reference file
-s,--specie <SPECIE>
RNAME flag SAM record (Reference sequence name)
-sf,--specieslist file <SPECIES LIST>
List with species for which damage profile has to be calculated.
-t,--threshold <THRESHOLD>
Number of bases which are considered for plotting nucleotide
misincorporations
-title,--title <TITLE>
Title used for all plots. Default: filepath of input SAM/BAM file.
-useall,--use_all_reads
Use all reads (mapped and unmapped) to calculate damage plot. Default:
false
-version,--version
Show version of DamageProfiler
-xaxis_histo_id_max,--xaxis_histo_id_max <XAXIS_HISTO_ID_MAX>
Maximal value x-axis of identity histogram.
-xaxis_histo_id_min,--xaxis_histo_id_min <XAXIS_HISTO_ID_MIN>
Minimal value x-axis of identity histogram.
-xaxis_histo_length_max,--xaxis_histo_length_max <XAXIS_HISTO_LENGTH_MAX>
Maximal value x-axis of length histogram.
-xaxis_histo_length_min,--xaxis_histo_length_min <XAXIS_HISTO_LENGTH_MIN>
Minimal value x-axis of length histogram.
-yaxis_damageplot,--yaxis_damageplot <YAXIS_DAMAGEPLOT>
Maximal value on y axis of damage plot.
実行方法
aDNAサンプルのbamファイルとbamのリファレンスfastaを指定する。
damageprofiler -i input.bam -r ref.fasta -o output_folder
- -i The input sam/bam file
GUIモード
damageprofiler
bam、ref.fasta、出力ディレクトリのパスを指定してRunボタンで実行。
出力ディレクトリ
aDNAのfastqは持っていないので、普通のサンプルでランした結果になります。
引用
DamageProfiler: Fast damage pattern calculation for ancient DNA
Judith Neukamm, Alexander Peltzer, Kay Nieselt
Bioinformatics, Published: 23 April 2021
関連