macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

膜貫通タンパク質の統合リソース UniTmp

 

 UNIfied database of TransMembrane Proteins (UniTmp)は、膜貫通タンパク質の構造情報を、タンパク質セグメントの局在、タンパク質のトポロジーから膜包埋3次元構造まで、様々なレベルで網羅的に収集した、自由にアクセス可能なリソースである。何万もの新しい構造や実験にアノテーションを施しただけでなく、これらのリソースを並行して提供できる新しいシステムを開発した。UniTmpは、TOPDB (Topology Data Bank of Transmembrane Proteins)、TOPDOM (database of conservatively located domains and motifs in proteins)、PDBTM (Protein Data Bank of Transmembrane Proteins)、HTP (Human Transmembrane Proteome)の各データベースを統合した統一プラットフォームであり、組み込まれたリソース間の相互運用性と、それらを定期的に更新する簡単な方法を提供する。現在の更新では、9235の膜包埋構造、9088の配列、536,035のトポロジーアノテーションされたセグメント、8692の保存的に局在するタンパク質ドメインまたはモチーフ、および5466のアノテーションされたヒト膜貫通タンパク質が掲載されている。UniTmpデータベースはhttps://www.unitmp.orgで利用できる。

 

webサービス

https://www.unitmp.org/にアクセスする。

〇は4つのTransmembraneデータベースへのリンクとなっている。

 

4つのD.Bについて(論文より)

  • PDBTM (Protein Data Bank of Transmembrane Proteins) は、実験的に決定された構造を、タンパク質に対する脂質二重層の向きとともに保存している。
  • TOPDB (Topology Data Bank of Transmembrane Proteins) は、あらゆる種類の実験的トポロジーデータを保存している。
  • TOPDOMは、膜の同じ側に一貫して位置する保存されたタンパク質ドメインとモチーフに関する情報を保存している。
  • Human Transmembrane Proteome(HTP) は、TMP構造の完全な理解への重要な一歩の例であり、これらの情報をまとめて保存することによって達成されている。

 

膜タンパク質名やIDを入れて検索する。

各タンパク質について、アミノ酸配列、UniProt Accession、UniProt ID、解決済みPDB構造、InterProのドメイン/モチーフ情報が格納され、配列プール(SwissProtのTMPタンパク質、ヒトリファレンスプロテオーム、実験データを持つ個々のタンパク質)を用いて、BLASTを用いて相同タンパク質のネットワークが作成されている。そのため、エントリーを検索すると、相同タンパク質も自動的にリストアップされる。


ヒット例

4つのデータベースそれぞれからのヒットが示される。

 

ヒットをクリックすると各DBの検索結果のページにジャンプする。

HTPで膜タンパク質を閲覧する例

 

 

各データベースをどのように統合したか論文で説明されています。ディスカッションででは、複数のデータベースを横断的に利用して包括的な情報を得ることで、タンパク質の正確なトポロジーを予測することができると書かれています。読んでみて下さい。

引用

UniTmp: unified resources for transmembrane proteins 
László Dobson, Csongor Gerdán, Simon Tusnády, Levente Szekeres, Katalin Kuffa, Tamás Langó, András Zeke, Gábor E Tusnády
Nucleic Acids Research, Volume 52, Issue D1, 5 January 2024, Pages D572–D578