macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

パスウェイデータベース PathBank

2020 2/11 誤字修正

2022 2/3 追記

 

 パスウェイマップは、分子生物学のロードマップである。ロードマップが村、町、都市間のつながりを示すように、パスウェイマップは遺伝子、タンパク質、代謝産物間のつながりを示す。よく描かれたパスウェイマップは、複雑な分子プロセスの生物学的背景を視覚的にわかりやすく示す。この点で、パスウェイマップは、科学者が「オミックスデータ」および「オミックス測定値を共有、統合、解釈、視覚化するための非常に有用な手段を提供している。現在でも、パスウェイマップ(つまりパスウェイデータベース)の編集は、バイオインフォマティクスの分野全体で最も頻繁に使用され、よく参照されるリソースの1つである。これは、ゲノミクス、メタゲノミクス、トランスクリプトミクス、プロテオミクスおよび/またはメタボロミクスのデータを解釈するために、パスウェイデータベースが広く求められているためである。さらに、細胞モデリング(1)、フラックスバランス分析(2)、遺伝子セットエンリッチメントアナリシス(3)、代謝産物セット濃縮分析(4)および過剰表現分析( 5)。

 商用およびオープンアクセスの両方のリソースを含む、さまざまなパスウェイデータベースが存在する。最もよく知られているオンラインパスウェイデータベースのいくつかは、最も古いものでもある。これらにはKEGG(ref.6)とCycデータベース(ref.7)が含まれる。どちらも1990年代半ばに登場した。これらのリソースは両方とも素晴らしいコレクションであり、毎日何千人もの科学者によって広く使用されている、広範で簡単に検索できるWebアクセス可能なパスウェイとアノテーションを提供している。最近では、(少数の)選択されたモデル生物のパスウェイを網羅する、Reactome(ref.8)やWikipathways(ref.9)などのパスウェイデータベースが数多く登場している。さらに、Wikipathwaysはコミュニティアノテーションモデルを採用し、Webの視覚化と対話性における多くの継続的な進歩を活用して、ややリッチなユーザー/投稿者エクスペリエンスを提供している。  BioCarta(https://cgap.nci.nih.gov/Pathways/BioCarta_Pathways)(ref.10)、InnateDB(ref.11)、PharmGKB(ref.12)、Pathway Interaction Database(ref.13)など、さまざまな特殊なパスウェイデータベースもある。 特定のパスウェイタイプ、特定の(単一の)生物に焦点を合わせたり、包括的なパスウェイデータベースのいとこよりも視覚的に印象的な方法でパスウェイを探索することができる。

 これらの自由に利用可能な、またはオープンアクセスのパスウェイデータベースに加えて、GeneGo(https://portal.genego.com/)、Protein Lounge(http://www.proteinlounge)またはIPA(Ingenuity Pathway Analysis)(https://www.qiagenbioinformatics.com/products/ingenuity-pathway-analysis/)などのいくつかのよく知られた商用パスウェイデータベースもある。特に、QiagenのIngenuity Pathway Analysisシステムは、パスウェイカバレッジおよびパスウェイ分析ツールの観点から、おそらく最も人気があり、最も広範な商業リソースである。

 上記の各パスウェイデータベースには多くの優れた機能が存在するが、いくつかの顕著な制限もある。たとえば、KEGGおよびCycデータベースは明らかに低分子パスウェイデータベースだが、脂質合成、代謝物シグナル伝達、低分子ホルモンシグナル伝達、または低分子薬物作用をカバーする多くのパスウェイを提供していない。 KEGGデータベースはいくつかのタンパク質シグナル伝達、発達および疾患プロセス経路を提供するが、CycDBは提供しない。 KEGGもCycDBも細胞応答に関連するパスウェイを提供せず、KEGGは細胞の位置や生物学的状況に関する情報を提供しない。 KEGGとCycデータベースは、今日のパスウェイデータベースの中で最も古いものであるため、Webベースのパスウェイ視覚化にやや時代遅れのアプローチを使用している。 ReactomeおよびWikipathwaysデータベースはやや最新のWebインターフェースを提供し、タンパク質および細胞シグナル伝達の多くの側面をカバーしているが、KEGGまたはCycデータベースよりも代謝の範囲がはるかに制限されている。同様に、ReactomeとWikipathwaysは、代謝物シグナル伝達、ホルモンシグナル伝達、薬物作用、および多くの一般的な疾患パスウェイをほとんど無視している。 ReactomeとWikipathwayのパスウェイ図には、最新のパスウェイ視覚化ツールを使用しても、BioCarta(ref.10)、DrugBank(ref.14)、SMPDB(ref.15)などの他のパスウェイデータベースに見られるパスウェイ図の視覚的魅力や生物学的コンテキストがまだ存在しない。

 理想的には、KEGGまたはCycデータベースにある包括的な代謝パスウェイカバレッジと、Reactome、WikipathwaysまたはIPAにある豊富なタンパク質/細胞シグナル伝達パスウェイカバレッジ、およびBioCartaまたはSMPDB-単一の無料のリソースが望まれる。ここでは、PathBankと呼ばれるまさにそのようなデータベースについて説明する。 PathBankは、10のモデル生物(ヒト、げっ歯類、植物、昆虫、微生物を含む)で見つかった110 000以上の機械可読パスウェイを含む、視覚的に豊富な包括的パスウェイデータベースである。

 PathBank(バージョン1.0)には、10のモデル生物(Homo sapiens、Bos taurus、Rattus norvegicus、Mus musculus、Drosophila melanogaster、Caenorhabditis elegans、Arabidopsis thaliana、Saccharomyces cerevisiae、Escherichia coli、 Pseudomonas aeruginosa)が含まれる。データベースには現在、78 488の異なる化合物(代謝産物、薬物、その他の生体異物を含む)、8993の異なるタンパク質が含まれ、176 535を超える異なる反応と相互作用が記述されている。 PathBankパスウェイは、2つの広いカテゴリまたはクラスに分類される:(i)代謝物/化合物パスウェイおよび(ii)タンパク質パスウェイ。代謝産物/化合物パスウェイには、パスウェイエンティティとしてのタンパク質と比較して、大部分(> 50%)の低分子が含まれている。タンパク質のパスウェイには、パスウェイエンティティとしての代謝産物と比較して、タンパク質の大部分(通常> 80%)が含まれている。 PathBankの現在のバージョンには、109 836の代謝/化合物パスウェイと398のタンパク質パスウェイがある。

 PathBankには、代謝/化合物パスウェイの6つのサブカテゴリがある。(i)代謝(異化/同化); (ii)生理学的/内分泌学的(主に代謝産物を含む); (iii)代謝シグナル伝達; (iv)薬物代謝; (v)薬物作用; (vi)疾患(主に小分子の代謝を含む)。代謝物/化合物パスウェイとは対照的に、タンパク質パスウェイには15のサブカテゴリがある。(i)免疫学的。 (ii)細胞応答; (iii)遺伝子調節; (iv)成長因子; (v)サイトカインシグナル伝達; (vi)タンパク質/ペプチドホルモン媒介; (vii)神経信号; (viii)発達シグナル伝達。 (ix)キナーゼシグナル; (x)アポトーシスシグナル伝達; (xi)ストレス活性化シグナル伝達; (xii)病原体活性化シグナル; (xiii)輸送/分解; (xiv)細胞骨格シグナル;および(xv)疾患(主にタンパク質の調節不全を含む)。 

(複数段落省略)

 PathBankは、他のパスウェイデータベースにはない多くの機能を提供する。これらの機能は、論文表1 (paper link)で強調されている。生物あたりのパスウェイの数の観点から、PathBankは公共データベースの中で最大かつおそらく最も包括的なコレクションを提供する。

 

User Guides

http://pathbank.org/pathwhiz/guides

Style Guide

http://pathbank.org/pathwhiz/style_guide 

他のpathwayデータベースへのリンク

 

webサービス

http://pathbank.org

f:id:kazumaxneo:20200209091530p:plain

 

 pathwayはPathWhiz(link)を用いて作成されている(作成にはlog inが必要)。

 

Browseタブからpathwayを閲覧できる。

f:id:kazumaxneo:20200210233833p:plain

 

ヒトのCatecholamine Biosynthesis(カテコールアミン生合成)を見てみる。

f:id:kazumaxneo:20200211082835p:plain

クリック、ドラッグ、およびスクロール操作ができる。また、マウスやtrackpadをスクロールすることでズームインおよびズームアウトできる。

 

metaboliteをクリックすると、構造や詳細な記述をみることができる。

f:id:kazumaxneo:20200211083423p:plain

 

別のハイパーリンクが埋め込まれている場合もある。

f:id:kazumaxneo:20200211083722p:plain

 

browseからは別のリンクが提供されている場合もある。検索対象をヒトに限定し、chemical Compoundsのリンクをクリックすると、

f:id:kazumaxneo:20200211085451p:plain

The Human Metabolome Database (HMDB)にジャンプする(E.coliならECMDB)。

f:id:kazumaxneo:20200211085943p:plain

f:id:kazumaxneo:20200211085951p:plain

f:id:kazumaxneo:20200211090007p:plain

f:id:kazumaxneo:20200211090017p:plain

f:id:kazumaxneo:20200211090035p:plain

f:id:kazumaxneo:20200211090037p:plain

f:id:kazumaxneo:20200211090040p:plain

 

タンパク質配列をクエリにして検索することもできる。

f:id:kazumaxneo:20220203202747p:plain



引用
PathBank: a comprehensive pathway database for model organisms

Wishart DS, Li C, Marcu A, Badran H, Pon A, Budinski Z, Patron J, Lipton D, Cao X, Oler E, Li K, Paccoud M, Hong C, Guo AC, Chan C, Wei W, Ramirez-Gaona M

Nucleic Acids Res. 2020 Jan 8;48(D1):D470-D478