macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Uniprotのパンプロテオーム

明けましておめでとうございます。

今年もよろしくお願い致します。

 

 パンプロテオームとは、closely related (高度に関連した)生物群(例えば、同じ細菌種の複数の株)によって発現されると考えられるタンパク質の完全な集合のこと(panはギリシャ語で"whole")。分類群内の全配列の代表的なセットを提供し、そのグループのリファレンスプロテオームだけでは見られないユニークな配列を捕捉することができる。

Uniprotが提供しているUniProtKBパンプロテオームは、主に種レベルの全ての非冗長プロテオームを網羅したもので、系統比較、ゲノム進化や遺伝子多様性の研究に利用できる。UniProt FTPの Pan proteomes/からダウンロードできるようになっている。

Pan proteomes

https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/pan_proteomes/

f:id:kazumaxneo:20211231231731p:plain

拡大

f:id:kazumaxneo:20211231231810p:plain

表示されているのはUNiprot Proteome identifier(UPID)という識別子UPIDは、UniProtのプロテオームを構成するタンパク質コレクションに割り当てられる一意の識別子で、UP'という文字と9桁の数字からなる。Uniprotの説明には、リリース間で安定しているため、UniProtプロテオームを引用する際に使用可能とある。

 

UPIDのIDはUniprot proteomesで検索できる。

UP00000012と検索。

f:id:kazumaxneo:20211231234241p:plain

リファレンスプロテオームとしてヒットしている。

 

 

関連

 

 

補足

あるプロテオームがより大きなパンプロテオームの一部であるタンパク質を持つ場合、プロテオームページの 'Pan proteome' の行にその旨が表示される。