RNAの発現の違いは、細胞の分子的アイデンティティ、ヒトの疾患に関与するパスウェイ、臨床表現型に関連する患者間のRNAレベルのばらつきなどについての洞察を提供する。m6AのようなRNA修飾は、RNAの分子機能に寄与することがわかっている。しかし、RNAの修飾の違いを定量化することは困難だった。ここでは、ダイレクトRNAシークエンシングデータからRNA修飾の違いを同定する計算手法(xPore)を開発した。この手法をトランスクリプトーム全体のm6Aプロファイリングデータで評価したところ、xPoreは1塩基の分解能でm6Aサイトの位置を特定し、細胞内の修飾RNAの割合を推定し、条件間の修飾率の違いを定量化することができた。また、この手法を6つの細胞株から得られたダイレクトRNAシークエンスデータに適用したところ、多くのm6Aサイトが保存されている一方で、一部のm6Aサイトは細胞種によって修飾率に大きな差があることがわかった。これらの結果から、ダイレクトRNAシーケンスからRNAの修飾を高い精度で同定することができ、1回のハイスループット実験で修飾の違いや発現の違いを解析することができることが分かった。xPoreは、オープンソースソフトウェアとして提供されている(https://github.com/GoekeLab/xpore)。
Documentation
Welcome to xPore’s documentation! — xpore 2.0 documentation
インストール
mamba create -n xpore python=3.7 -y
conda activate xpore
pip install xpore
> xpore-dataprep -h
$ xpore-dataprep -h
usage: xpore-dataprep [-h] --eventalign EVENTALIGN --summary SUMMARY --out_dir
OUT_DIR [--ensembl ENSEMBL] [--species SPECIES]
[--genome] [--n_processes N_PROCESSES]
[--readcount_max READCOUNT_MAX] [--resume]
required arguments:
--eventalign EVENTALIGN
eventalign filepath, the output from nanopolish.
(default: None)
--summary SUMMARY eventalign summary filepath, the output from
nanopolish. (default: None)
--out_dir OUT_DIR output directory. (default: None)
--ensembl ENSEMBL ensembl version for gene-transcript mapping. (default:
91)
--species SPECIES species for ensembl gene-transcript mapping. (default:
homo_sapiens)
optional arguments:
-h, --help show this help message and exit
--genome to run on Genomic coordinates. Without this argument,
the program will run on transcriptomic coordinates
(default: False)
--n_processes N_PROCESSES
number of processes to run. (default: 1)
--readcount_max READCOUNT_MAX
maximum read counts per gene. (default: 1000)
--resume resume from the previous run. (default: False)
> xpore-diffmod -h
$ xpore-diffmod -h
usage: xpore-diffmod [-h] --config CONFIG [--n_processes N_PROCESSES]
[--save_models] [--resume] [--ids [IDS [IDS ...]]]
required arguments:
--config CONFIG yaml configuraion filepath. (default: None)
optional arguments:
-h, --help show this help message and exit
--n_processes N_PROCESSES
number of processes to run. (default: 1)
--save_models save the models. (default: False)
--resume resume from the previous run. (default: False)
--ids [IDS [IDS ...]]
gene ids or transcript ids. (default: [])
テストラン
https://xpore.readthedocs.io/en/latest/quickstart.html
wget https://zenodo.org/record/5103099/files/demo.tar.gz
tar -xvf demo.tar.gz
xpore-dataprep \
--eventalign nanopolish/eventalign.txt \
--gtf_path_or_url demo.gtf \
--transcript_fasta_paths_or_urls demo.fa \
--out_dir dataprep \
--genome \
--summary SUMMARY
nanopolish/eventalign.txtはnanopolish eventalignコマンドで取得する。
引用
Detection of differential RNA modifications from direct RNA sequencing of human cell lines
Ploy N. Pratanwanich, Fei Yao, Ying Chen, Casslynn W.Q. Koh, Christopher Hendra, Polly Poon, Yeek Teck Goh, Phoebe M. L. Yap, Choi Jing Yuan, Wee Joo Chng, Sarah Ng, Alexandre Thiery,W.S. Sho Goh, Jonathan Göke
bioRxiv, Posted June 20, 2020