macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

病原性細菌の比較トランスクリプトームおよび共発現データベース bacteria.guru

 

 細菌は単細胞の原核生物であり、相互作用から寄生まで様々な共生関係を築くことができる。細菌の病原性に対抗するためには、遺伝子の機能と制御に関する理解を深めることが必要であり、それが新しい抗菌薬の開発につながる。 Gene expressionは遺伝子の機能を予測することができるが、細菌の遺伝子発現プロファイルや共発現ネットワークを種間・種間で広範に探索できるデータベースはない。そこで、著者らは、最も有名で研究されている17種類の細菌性病原体のゲノムおよびトランスクリプトームデータを統合し、遺伝子発現プロファイル、共発現ネットワーク、機能的に濃縮されたクラスター、および遺伝子ファミリーを種を超えて同定、視覚化、比較できるインタラクティブなデータベースbacteria.guruを作成した。また、緑膿菌抗生物質耐性メカニズムを示すことで、bacteria.guruが多面的な抗生物質ターゲットの発見に役立つ可能性を示す。このように、bacteria.guruは今後の細菌研究を促進すると考えている。データベースと共発現ネットワークは、https://bacteria.guru/ から自由に入手できる。サンプルのアノテーションはsupplemental dataにある。

 

Tutorial

https://github.com/sepro/CoNekT/blob/master/docs/tutorials/overview.md

 

Github

 

webサービス

https://bacteria.sbs.ntu.edu.sg/にアクセスする。

f:id:kazumaxneo:20210819221512p:plain

Helpより

CoNekTの最大の特徴は、Sequence Read Archiveに登録されている何千ものRNASeqサンプルを、丁寧にアノテーションした上で収録していることです。各遺伝子について、アノテーションされたサンプルにおける発現の概要(発現プロファイル)が得られます。また、複数の遺伝子のデータを用いてヒートマップを作成し、様々な統計処理を施すことで、特定の条件、組織、臓器に特異的な遺伝子を検出することができます。

 

 

上のSpeciesボタンから現在どの種がCoNekTに含まれているかを確認できる、

f:id:kazumaxneo:20210819221728p:plain

Vibrio choleraeを見てみる。

f:id:kazumaxneo:20210819225243p:plain

全遺伝子(3648 Transcripts)がリスト表示される。

 

遺伝子をクリックすると様々な条件での発現量(TPM)が表示される。

f:id:kazumaxneo:20210820083507p:plain

この遺伝子はlow abundanceだった。

f:id:kazumaxneo:20210820083656p:plain

 

共発現ネットワークと機能的アノテーションへのリンクも提供される(右端のボタン)。

f:id:kazumaxneo:20210820083746p:plain

View cluster as graph

f:id:kazumaxneo:20210820084110p:plain

Compare profiles

f:id:kazumaxneo:20210820084132p:plain


Heatmap of profiles in this cluster

f:id:kazumaxneo:20210820084242p:plain



OrthoFinderで定義された遺伝子ファミリーの表と系統樹

f:id:kazumaxneo:20210820084723p:plain

右端にはTPMの発現量がヒートマップ表示されるが、試した時は機能しなかった。

 

TopページではGOのIDや遺伝子のIDで検索できる。

f:id:kazumaxneo:20210819224911p:plain

 

検索結果

f:id:kazumaxneo:20210819225001p:plain

 

メニューのツールから様々な方法で発現量を比較できるようになっている。

f:id:kazumaxneo:20210820085427p:plain

 

Create Heatmap

上のメニューボックスで種を選択、中央のウィンドウで遺伝子をタイプする。

f:id:kazumaxneo:20210820085600p:plain

視覚化結果

f:id:kazumaxneo:20210820085532p:plain

 

Compare profiles

f:id:kazumaxneo:20210820085822p:plain

各条件の発現量テーブルの出力(TSV形式)

f:id:kazumaxneo:20210820090135p:plain

 

引用

Bacteria.guru: comparative transcriptomics and co-expression database for bacterial pathogens
Peng Ken Lim, Emilia E Davey, Sean Wee, Wei Song Seetoh, Jong Ching Goh, Xinghai Zheng, Sean Kia Ann Phang, Eugene Sheng Kai Seah, Janice Wan Zhen Ng, Xavier Jia Hui Wee, Aloysius Jun Hui Quek, Jordan JingHeng Lim, Edbert Edric Rodrigues, Heesoo Lee, Chin Yong Lim, Wei Zhi Tan, Yuet Ruh Dan, Bronson Lee, Samuel En Le Chee, Zachary Ze En Lim, Jia Sheng Guan, Ivan Jia Le Tan, Trinidad Jeremiah Arong, Marek Mutwil

bioRxiv, Posted August 04, 2021