macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ディープラーニングを用いたタンパク質の翻訳後修飾部位予測と可視化のためのウェブサーバ MusiteDeep

 

 MusiteDeepは、タンパク質の翻訳後修飾(PTM)部位の予測および可視化のためのディープラーニングフレームワークを提供するオンラインリソースである。この予測ツールは、タンパク質の配列のみを入力とし、複雑な特徴を必要としないため、多数のタンパク質に対してリアルタイムに予測することができる。1つのPTMタイプにつき1000の配列に対して、予測にかかる時間は3分未満である。出力は、ユーザーが選択したPTMタイプについて、アミノ酸レベルで表示される。このフレームワークベンチマークされ、他の研究者によるPTMサイト予測において競争力のある性能を実証している。本ウェブサーバでは、より高度なアンサンブル技術を利用し、複数のPTMの予測と可視化を同時に行い、ユーザーが潜在的なPTMクロストークを直接分析できるように、従来のフレームワークを更新した。予測だけでなく、ユーザーは既知のPTMアノテーションやタンパク質の立体構造との関連において、予測されたPTM部位を相同性検索によりインタラクティブに確認することができる。さらに、Uniport/Swiss-Protから前処理されたPTMアノテーションを提供するローカルデータベースを維持し、ユーザーがダウンロードすることができる。このデータベースは3ヶ月ごとに更新される。MusiteDeepサーバは、https://www.musite.net で公開されている。MusiteDeepをローカルに使用するためのスタンドアローンツールは、https://github.com/duolinwang/MusiteDeep_webで利用できる。

 

 

webサービス

https://www.musite.net/にアクセスする。

翻訳後修飾部位(PTM)を予測するための複数のモデルを構築している。複数のモデルを同時に選択して予測することができる。

 

FASTA形式のタンパク質配列を入力する。大規模な予測タスクでは、FASTA形式の配列をアッロードする。start predictionをクリック。

貼り付ける場合、最大 10 配列または 5000 アミノ酸を許容している。FASTA形式の配列をアッロードする場合、最大10MBとなっている。ジョブが送信されると、処理のための待ち行列に入れられる。。このモードでは、1人のユーザーが同時に5つまでのジョブを処理できるように割り当てられる(マニュアルより)。

 

exampleの出力

各入力配列の結果が1つずつ可視化される。

 

予測された翻訳語修飾部位(PTM)は、対応する位置の上にその略語でラベル付けされる。複数のPTMがあると予測された場合、1つの位置の上に複数のラベルが表示される。予測された部位のハイライトされた色は、その予測の信頼度に対応している(マニュアルより)。

リン酸化、グリコシル、ユビキチン化、SUMO化、アセチル化、メチル化、ピロリドンカルボン酸化、パルミトイル化、ヒドロキシル化など。

 

スライダーを使って予測信頼度の閾値を調整し、予測される部位の数を増やしたり減らしたりできる。

 

BLAST based annotationボタンを押すと、Uniprot/Swiss-Prot のタンパク質に対してクエリの配列の相同性検索を行い、アラインメントされた位置の既知の PTM アノテーションを表示することができる。

 

現在の配列の相同配列が、選択した PTM タイプに応じて、既存の PTM アノテーションとともに青色でハイライト表示される。

 

 

View predicted proteinボタンを押すと、予測された PTM 部位を立体構造で表示できる。ボタンをクリックすると、3次元構造が既知の相同なPDBのタンパク質のリストが新しいタブに表示される。右端のshow 3Dをクリック。

 

出力

 

ハイライトされたラベルは予測された部位の情報を表す。

 

引用

MusiteDeep: a deep-learning based webserver for protein post-translational modification site prediction and visualization 
Duolin Wang, Dongpeng Liu, Jiakang Yuchi, Fei He, Yuexu Jiang, Siteng Cai, Jingyi Li, Dong Xu
Nucleic Acids Research, Volume 48, Issue W1, 02 July 2020, Pages W140–W146