macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ONT ダイレクトRNA seqで修飾された塩基を検出する nanocompore

 

 RNA分子は、その構造や相互作用に影響を与える転写後修飾(PTM)を受けている。現在までに、150以上の天然に存在するPTMが同定されているが、その機能の大部分は未だ不明である。近年、少数のPTMが、ハイスループットシーケンシングを用いた実験的アプローチにより、トランスクリプトームへのマッピングに成功している。オックスフォード・ナノポア・ダイレクトRNAシーケンシング(DRS)技術は、RNAの改変に敏感であることが示されている。著者らは、DRSデータ中の改変の有無を評価するための堅牢な解析フレームワークであるNanocomporeを開発・検証した。そのためには、関心のあるRNAサンプルを、改変されていない対照サンプルと比較する。この戦略は、トレーニングセットを必要とせず、生物学的変動性をモデル化するためのレプリケートの使用を可能にする。ここでは、ヒトpolyA+ RNAや標的とするノンコーディングRNARNAの1分子分解能でのRNA修飾を検出するNanocomporeの能力を実証する。結果は直交法とよく相関し、N6-メチルアデノシン部位の分布に関するこれまでの観察結果を確認し、コード化および非コード化トランスクリプトームにおけるRNA修飾の分布についての新たな洞察を提供するものである。Nanocompore の最新版は https://github.com/tleonardi/nanocompore から入手できる。

 

 

nanocomporeはPythonAPIとしての活用と、コマンドラインでの使用の2種類の使用方法がある。ここではコマンドラインでの基本的な使用手順についてまとめる。 

インストール

condaを使ってpython3.6の仮想環境を作成し、そこでpipを使って導入した(ホストOSはubuntu18.04)。

Github

#bioconda(link)
conda create -n nanocompore python=3.6
conda activate nanocompore
#pip
pip3 install nanocompore

#or conda
conda install -c bioconda nanocompore -y

nanocompore -h

$ nanocompore -h

usage: nanocompore [-h] [--version] {sampcomp,simreads,plot} ...

 

Software package that identifies raw signal changes between two conditions

from https://github.com/jts/nanopolish resquiggled dRNA-Seq data.

 

positional arguments:

  {sampcomp,simreads,plot}

                        Nanocompore implements the following subcommands

    plot                Run downstream analysis and plot results

 

optional arguments:

  -h, --help            show this help message and exit

  --version, -v         show program's version number and exit

 

 

実行方法

ケースコントロールの2サンプルを比較することで修飾された塩基を検出する。入力のTSVファイルはbasecallしたONT.fastqをリファレンスにマッピングし、それからresquigglingして作成する。手順はこちらに記載されている。

nanocompore sampcomp \
--file_list1 ./data/S1_R1.tsv,./data/S1_R2.tsv \
--file_list2 ./data/S2_R1.tsv,./data/S2_R2.tsv \
--label1 S1 \
--label2 S2 \
--fasta ./reference/ref.fa \
--outpath ./results/

 

引用

RNA modifications detection by comparative Nanopore direct RNA sequencing

Adrien Leger, Paulo P. Amaral, Luca Pandolfini, Charlotte Capitanchik, Federica Capraro, Isaia Barbieri, Valentina Migliori, Nicholas M. Luscombe, Anton J Enright, Konstantinos Tzelepis, Jernej Ule, Tomas Fitzgerald, Ewan Birney, Tommaso Leonardi, Tony Kouzarides 

bioRxiv, Posted November 15, 2019

 

関連