macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

植物の公共RNA-Seqライブラリを分析するためのユーザーフレンドリ―なデータベース PPRD

 

 ハイスループットRNA-sequencing(RNA-seq)は、その低コストと高いカバレッジにより、ここ10年で最も人気のある遺伝子発現プロファイリング技術になった。その結果、植物界からのRNA-seqライブラリの数は近年飛躍的に増加している。トウモロコシ、イネ、ダイズ、小麦、綿花などの主要作物について、2021年までに合計~45,000のライブラリを収集した。RNA-seqライブラリのビッグデータを最大限に活用するためには、統一された処理パイプラインによってすべての公開ライブラリを統合し、使いやすい検索可能なデータベースにキュレーションする取り組みが緊急に必要とされている。この課題に取り組むため、本著者らはウェブベースの包括的なプラットフォーム、Plant Public RNA-seq Database (PPRD, http://ipf.sustech.edu.cn/pub/plantrna/)を発表する。PPRDは、Gene Expression Omnibus (GEO), Sequence Read Archive (SRA), European Nucleotide Archive (ENA), and DNA Data Bank of Japan (DDBJ) データベースからのトウモロコシ (11,726), イネ (19,664), ダイズ (4,085), コットン (3,483) の多数の RNA-seq library から構成されている。

 

tutorial

http://ipf.sustech.edu.cn/pub/zmrna/tutorials.php

 

tutorialより

  • PPRDは、標準化されたパイプラインを使用して、各ライブラリーの各遺伝子の発現量を算出しています。
  • PPRDは、入力された遺伝子IDとライブラリIDを検索し、基本的な説明と発現量を返すことができます。
  • PPRDは、検索結果のダウンロードと共有をサポートしています。
  • PPRDは、IGV-webインターフェースも内蔵しています。
  • PPRDは、他の生物種のホモログにアクセスし、その発現を確認することもできます。

 

webサービス

http://ipf.sustech.edu.cn/pub/plantrna/にアクセスする。

f:id:kazumaxneo:20220130230652p:plain

Maizeをクリックした。

 

googleライクな検索を行うことができる。

f:id:kazumaxneo:20220130231027p:plain

 

キーワード、IDなど様々な方法で検索できる。

f:id:kazumaxneo:20220130234453p:plain

 

SRA accession IDで検索した。

f:id:kazumaxneo:20220130233642p:plain

 

Data Plotタブでは発現量(FPKM)のテーブルを閲覧できる。

f:id:kazumaxneo:20220130233953p:plain

およそ68000万遺伝子(行)あるが、とてもスムーズに動作する。

 

見出し行をクリックすると列ソートができる。見出し行のボックスからはフィルタリングもできる。

f:id:kazumaxneo:20220131003554p:plain

 

3つIDをカンマ区切りでタイプして検索した。

f:id:kazumaxneo:20220130234636p:plain

 

データテーブルタブでは検索したIDの列全て(ここでは3列)が確認できる。

f:id:kazumaxneo:20220130234914p:plain

右上のdownload ボタンからexcel形式の表をダウンロードできる。

 

Data plotタブ

f:id:kazumaxneo:20220131000116p:plain

 

IGV Onlineタブ

f:id:kazumaxneo:20220131000359p:plain

 

次はGene Symbolで検索する。

f:id:kazumaxneo:20220131001648p:plain

 

Data Tableでは、今度はサンプルが行となる。コムギは5816サンプルあるので5816行ある。

f:id:kazumaxneo:20220131002350p:plain

Data Plotでは、その遺伝子の組織ごと、品種ごとの発現量の分布が示される。

f:id:kazumaxneo:20220131002715p:plain

box plotをクリックすると拡大図が表示される。

f:id:kazumaxneo:20220131003252p:plain

 

Coexpression

neighborhoodで共発現している遺伝子のリスト

f:id:kazumaxneo:20220131002818p:plain

 

複数遺伝子の検索にも対応している。

f:id:kazumaxneo:20220131002948p:plain

 

より柔軟なキーワード検索も可能になっている。

f:id:kazumaxneo:20220131003904p:plain

 

アクセスしてみて下さい。

引用

PPRD: a comprehensive online database for expression analysis of ~45,000 plant public RNA-Seq libraries
Yiming Yu,  Hong Zhang, Yanping Long, Yi Shu,  Jixian Zhai

bioRxiv, Posted January 29, 2022

 

関連