macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

UniprotのID変換webサービスを使い、UniProt accessionsからタンパク質のアノテーションを得る

2020 2/4 追記

 

UniProtのRetrieve/ID mappingサービスを使用すると、UniProt accessions IDからGenbankの配列、PDBのID、Entrez Gene ID、GI nnumber、タンパク質のアノテーションなどに変換できる。

 


Converting UniProt identifiers to external identifers (or vice versa)

https://www.ebi.ac.uk/training/online/course/uniprot-exploring-protein-sequence-and-functional/how-use-uniprot-tools/batch-retrieval-id--0


使い方

Retrieve/ID mapping

https://www.uniprot.org/uploadlists/ にアクセスする。

f:id:kazumaxneo:20200130110124p:plain

 

Retrieve/ID mappingの使い道はたくさんあるが、ここでは、UniProtのaccessions IDからタンパク質のアノテーションを得るために利用する。Uniprotをデータベースとして、Diamondによるblast検索を実行して得たtabularファイルになる。

 


IDをペーストする。

f:id:kazumaxneo:20200130112430p:plain

 

入力フォーマットを指定する。

f:id:kazumaxneo:20200130112205p:plain

次に出力フォーマットを指定する。ここではUniprotKBを指定(またはGene name)。

f:id:kazumaxneo:20200130112133p:plain

 

出力された。

f:id:kazumaxneo:20200130112826p:plain



結果は様々な形式でダウンロードできる。

f:id:kazumaxneo:20200130112700p:plain

excel形式でダウンロードしてexcelで開いた。

f:id:kazumaxneo:20200130112746p:plain

 

追記

Uniprot propteomeへのDIAMOND blastx検索結果をクエリにする

f:id:kazumaxneo:20200204122254p:plain

 

UniProtKB => Uniref100

f:id:kazumaxneo:20200204122047p:plain

出力

f:id:kazumaxneo:20200204122227p:plain

 

引用

Retrieve/ID mapping

 

関連