macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

植物の比較トランスクリプトームデータベース Plant Expression Omnibus(PEO)

 

 Plant Expression Omnibus (PEO)は、100以上の植物種、約60,000の手作業でアノテーションされたRNA-seqサンプル、400万以上の遺伝子の遺伝子発現に関する知見を生物学者に提供するウェブアプリケーションである。このツールにより、ユーザーは異なる器官にわたる遺伝子の発現パターンを探索し、器官特異的遺伝子を同定し、目的の遺伝子について共発現の上位遺伝子を発見することができる。PEOはまた、各遺伝子の機能アノテーションを提供し、遺伝的モジュールやパスウェイの同定を可能にする。PEOは、キングダム全体の遺伝子発現比較解析を容易にし、植物生物学研究のための貴重なリソースを提供するように設計されている。花粉被膜生合成における候補遺伝子の同定、およびトウガラシにおけるカプサイシンの生合成経路成分の調査におけるPEOの有用性を示す2つのケーススタディを提供する。データベースはhttps://expression.plant.tools/で利用できる。

 

help

https://expression.plant.tools/help


webサービス

https://expression.plant.tools/にアクセスする。

 

遺伝子IDをタイプする。

 

検索結果。1つヒットした。クリックする。

このページの左端にあるSearch by protein sequenceから、タンパク質配列を指定してDIAMONDサーチによって類似タンパク質を見つけることができる。

 

Search by protein sequence

 

出力

 

ここでは最初の検索でヒットした遺伝子を見てみる。

LOC_OS01G06450.1(イネ)。組織ごとの発現量がTPM値で示される。発現の特異性を表すSPMという単位が使用されている。SPMはゼロから1の値を取る。SPMが最も高い3つの組織はグラフの上に表示される。

 

SPMのトップ3の組織が表示されている。クリックすると、その組織で特異的に発現している遺伝子のリストにジャンプする。

Rootをクリック。

 

Rootで特異的に発現している遺伝子がSPMの降順で表示される。上のメニューから、植物種を選べる。写真ではSolanum lycopersicumとなっている。

SPMは従来、各器官の平均TPMを考慮して計算される。しかし、これは極端な外れ値のために歪みが生じやすい。ここでは平均値と中央値の両方を用いたSPMの結果を示す(Manualより)。

 

1つ見てみる。たしかにRootで特異的に発現している。

 

検索結果の下の方では、Mapman(HP)の機能的カテゴリに従って検索対象の遺伝子のカテゴリが示されている。

21.2.2.1.3.1をクリック。

 

21.2.2.1.3.1の結果。それぞれの植物種について、このカテゴリに属する遺伝子IDの一覧が表示されている。

Mapman Bin 21.2.2.1.3.1(Bin name: Cell wall organisation.hemicellulose.xylan.biosynthesis.xylosyltransferase activities.xylosyltransferase *(IRX9))

このMapmanページでは、生物学的機能から検索することができる(上のウィンドウから)。例えばセルロース合成を研究している場合、細胞壁形成ビンをクリックし、次のページで興味のあるサブビンを選択する(マニュアルより)。

 

検索結果のさらに下には、PFAMの結果がある。

PFAM annotations

クエリのタンパク質のドメインが決まっている場合はPFAMのリンクがある。クリックする。

 

PFAM PF03360:Glycosyltransferase family 43(GO Terms: GO:0015018, GO:0016020)について、それぞれの植物種のこのドメインを持つ遺伝子IDの一覧が示されている。

結果の画面の上の検索ウィンドウでキーワードを入力すると、その単語を説明文に含む全てのPFAMドメインが表示される。例えばcelluloseと入力すると、その単語を説明文に含む全てのPFAMドメインが表示される。ドメインのリンク(例:PF03552)をクリックすると、このドメインを持つ全ての遺伝子が表示される。

 

検索結果のさらに下には、クエリの遺伝子と共発現している遺伝子:Top-co-expressed genesの一覧がある。右端はPearson Correlation Coefficient (PCC) 。ピアソンの相関係数の降順に並んでいる。

 

 

Mapman binsタブではMapman の機能的アノテーションが示されている。

 

Bin1のphotosynthesisを見てみる。選択したビンのチャイルドビンが表示される。


チャイルドビンのIDをクリックすると、そのIDの遺伝子一覧が植物種ごとに表示される。画像はチャイルドビン1.1.1.1.1:hotosynthesis.photophosphorylation.photosystem II.LHC-II complex.component *(LHCb1/2/3)の結果

A.thalianaはAT1G29910, AT1G29920, AT1G29930, AT2G05070, AT2G05100, AT2G34420, AT2G34430, AT3G27690, AT5G54270の遺伝子を持つことが分かる。

 

  • 目的の生物種がある場合は、Species ページに移動し、目的の生物種をクリックする。例えばポプラのセルロース合成を研究している場合、検索ボックスにpopulusと入力し、Populus trichocarpaをクリックし、検索ボックスにcelluloseと入力する。

引用

PEO: Plant Expression Omnibus – a comparative transcriptomic database for 103 Archaeplastida
Eugene Koh, William Goh, Irene Julca, Erielle Villanueva, Marek Mutwil

bioRxiv, Posted June 22, 2023