macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

一塩基変異や逆転写酵素によるアレストイベントを検出する JACUSA2

 

シーケンシングデータからRNA修飾を検出するためのハイスループットな抗体不要の方法がいくつか開発されている。ここでは、IlluminaまたはNanoporeプラットフォームをベースとするRNA修飾検出アッセイのための多用途ソフトウェアソリューションおよび包括的な解析フレームワークとしてJACUSA2を紹介する。重要なことは、JACUSA2は、複製や異なる条件などの複数の実験や、1本鎖または2本鎖のcDNAライブラリなどの異なるライブラリタイプからの情報を統合できることである。著者らは、IlluminaまたはNanoporeのシーケンスデータセットにおけるN6-メチルアデノシン(m6A)とプソイドウリジン(Ψ)検出の解析ワークフローを示し、その有用性を実証した。このソフトウェアとRヘルパーパッケージは、オープンソースとして提供されている。

 

manual

https://github.com/dieterich-lab/JACUSA2/blob/master/manual/manual.pdf

 

インストール

v2.0.2 static binaryをリリースからダウンロードしてテストした(openjdk 11.0.1環境)。

依存

  • tested JACUSA2 with Java v1.8

Github

> java -jar JACUSA_v2.0.2-RC.jar 

usage: JACUSA2 <METHOD> <METHOD-OPTIONs> <BAMs>

  METHOD    DESCRIPTION

  call-1    Call variants - 1 condition

  call-2    Call variants - 2 conditions

  pileup    SAMtools like mpileup - 2 conditions

  rt-arrest    Reverse Transcription Arrest - 2 conditions

  lrt-arrest    Linkage arrest to base substitution - 2 conditions

Version:    2.0.2-RC

Libraries:     htsjdk 2.12.0, Apache commons-cli 1.4, Apache commpon-math3 3.6.1

java -jar JACUSA_v2.0.2-RC.jar call-1

usage: JACUSA call-1 [OPTIONS] BAM1_1[,BAM1_2,...]

 -A                    Show all sites - including sites without variants

 -a <FEATURE-FILTER>   [...] Use -h to see extended help

 -B <READ-TAG>         Tag reads by base substitution.

                       Count non-reference base substitution per read and stratify.

                       Requires stranded library type.

                       (Format for T to C mismatch: T2C; use ',' to separate substitutions)

                       Default: none

 -b <BED>              BED file to scan for variants

 -c <MIN-COVERAGE>     filter positions with coverage < MIN-COVERAGE

                       default: 5

 -D                    Show deletion score

 -d <MAX-DEPTH>        max read depth

                       default: -1

 -f <OUTPUT-FORMAT>    Choose output format:

                       <*> B: BED6-extended result format

                       < > V: VCF Output format. Option -P will be ignored (VCF is unstranded)

 -F <FLAG>             filter reads with flags FLAG

                       default: 0

 -filterNH <NH>        Max NH-VALUE for SAM tag NH for all conditions

 -filterNM <NM>        Max NM-VALUE for SAM tag NM for all conditions

 -h                    Print extended usage information

 -I                    Show insertion score

 -m <MIN-MAPQ>         filter positions with MAPQ < MIN-MAPQ

                       default: -1

 -p <THREADS>          use # THREADS

                       default: 1

 -P <LIB-TYPE>         Choose the library type for all conditions:

                       RF-FIRSTSTRAND    STRANDED library - first strand sequenced

                       FR-SECONDSTRAND    STRANDED library - second strand sequenced

                       UNSTRANDED        UNSTRANDED library

                       default: UNSTRANDED

 -q <MIN-BASQ>         filter positions with base quality < MIN-BASQ

                       default: 20

 -R <REF-FASTA>        use reference FASTA file (must be indexed)

 -r <RESULT-FILE>      results are written to RESULT-FILE

 -s                    Store feature-filtered results in another file (= RESULT-FILE.filtered if no argument) or (= FILTERED-FILE)

 -T <THRESHOLD>        Filter positions based on test-statistic THRESHOLD

                       default: DO NOT FILTER

 -u <MODE>             [...] Use -h to see extended help

 -w <WINDOW>           size of the window used for caching. Make sure this is greater than the read size

                       default: 10000

 -W <THREAD-WINDOW>    size of the window used per thread

                       default: 100000

 

 

 

実行方法

call-1メソッドは、リファレンス配列に対してバリアントをコールする。MDフィールドを出すアライナー(BWAなど)を使う必要がある。

java -jar jacusa2.jar call-1 -r results_call1.out -p 12 alignments.bam
  • -p      use # THREADS
  •  -r     results are written to RESULT-FILE

 

call-2メソッドは、2つの条件でバリアントを同定する。

java -jar jacusa2.jar call-2 results_call2.out condition1.bam condition2.bam

 

  • JACUSA2helper   JACUSA2出力のダウンストリーム解析をサポートするRのヘルパーの新しいバージョン。アーテファクトのフィルタリングなどを行う。

 

引用

RNA modification mapping with JACUSA2
Michael Piechotta, Isabel S. Naarmann-de Vries, Qi Wang, Janine Altmüller & Christoph Dieterich 
Genome Biology volume 23, Article number: 115 (2022)