macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

グラフ畳み込みネットワークによりタンパク質の機能予測を行う DeepFRI

 

 配列データベースに登録されるタンパク質数の急増とその機能の多様化により、自動的な機能予測のための計算機によるアプローチが課題となっている。本発表では、タンパク質言語モデルとタンパク質構造から抽出した配列特徴を利用して、タンパク質の機能を予測するグラフ畳み込みニューラルネットワーク、DeepFRIを紹介する。DeepFRIは、現在の主要な手法や配列ベースの畳み込みニューラルネットワークを凌駕し、現在の配列レポジトリのサイズに合わせた拡張が可能である。実験的な構造のトレーニングセットをホモロジーモデルで補強することで、予測可能な機能の数を大幅に拡張することができる。DeepFRIは、実験的な構造をタンパク質モデルに置き換えても、性能の低下はわずかであり、大きなデノイズ能力を備えている。クラス活性化マッピングにより、これまでにない分解能で機能予測が可能となり、残基レベルでの部位特異的なアノテーションを自動で行うことができる。PDBとSWISS-MODELの構造をアノテーションし、いくつかの新しい確信に満ちた機能予測を行うことで、本手法の有用性と高い性能を示す。DeepFRIはウェブサーバーとして、https://beta.deepfri.flatironinstitute.org/ で公開されている。

 

Github

 

webサービス

https://beta.deepfri.flatironinstitute.org/

 

 

構造ファイル(.pdbなど)かタンパク質配列を指定する。圧縮して提供する事で複数指定することもできる。

複数指定した場合はDashboardにその配列がリストとして表示される。

PDBファイル4つをZIP圧縮して提供した時のジョブキュー。

 

出力例

予測されたGO termの部位がハイライト表示される。

 

 

引用

Structure-based protein function prediction using graph convolutional networks
Vladimir Gligorijević, P. Douglas Renfrew, Tomasz Kosciolek, Julia Koehler Leman, Daniel Berenberg, Tommi Vatanen, Chris Chandler, Bryn C. Taylor, Ian M. Fisk, Hera Vlamakis, Ramnik J. Xavier, Rob Knight, Kyunghyun Cho & Richard Bonneau 
Nature Communications volume 12, Article number: 3168 (2021) 

 

関連