Foldyは、専門家ではない科学者がAlphaFoldやDiffDockなどのAIベースの高度な構造生物学ツールに簡単にアクセスして利用できるようにするクラウドベースのアプリケーションである。Kubernetes上に構築されているため、大学、学部、研究室がハードウェアリソースを必要とせずに導入できるほか、利用可能なコンピュータを活用するように設定することもできる。Foldyは、3000アミノ酸までのタンパク質や複合体の構造予測、Pfamアノテーションの可視化、AutoDock VinaとDiffDockによるリガンドのドッキングを可能にする。この原稿では、Foldyのユーザーインターフェイスと展開の考慮点、およびいくつかのアプリケーションについて説明する。Foldyは、高度なAIベースのツールへのアクセスを民主化することで、生命科学研究を促進し、構造バイオインフォマティクスツールの普及を促進する。本研究は、Foldyのようなユーザーフレンドリーなプラットフォームを通じて、最先端のツールであっても多くの人が利用できるようになることを実証しており、科学分野の枠を超えた研究者にとって貴重なリソースとなることを確信している。ローレンスバークレー研究所で公開されているFoldyのデプロイメントは、https://foldy.lbl.gov で見ることができる。
Foldy-in-a-box (easy to setup)
foldy/deployment/foldy-in-a-box/README.md at main · JBEI/foldy · GitHub
デモンストレーション用に公開されているインスタンスを簡単にみてみます。
https://foldy.lbl.govにアクセスする。LBL Foldy view onlyと出ている。初回は右上からアカウントを作成する。
左上のDashboardを選択
ここに自分のリストが表示される。アカウント作成直後の現在は何も表示されていない。
Newを選択
Monomerの予測。ウィンドウ内に配列をペーストする。Advanced optionでさらにパラメータを指定後、下のサブミットボタンから構造予測を実行できる。
注;このインスタンスでは、関係者以外のアカウントではサブミットできない。Foldyの機能を使用するには、Google Cloudマシン上にフル機能のFoldyインスタンスを作成する必要がある。作成する手順はレポジトリで紹介されている。
Multimerの予測。各chainの配列をペーストする。
既に予測済みで閲覧権限のある立体構造を閲覧してみる。
Structureビュー。2つの列があり、左側が予測された構造、右側がツールパネルとなっている。構造は自由にスクロール、拡大縮小、回転ができる。ツールパネルはタブで切り替え可能で、INPUTSタブには基本的な情報が表示される。
FILESからデータはダウンロードできる。
PAE;Predicted aligned error (PAE)は、残基のペアごとに距離の誤差を示す。タンパク質構造予測の信頼性を示す指標として使用される(サイトより)。
コンタクトマップ。2つのドメインやモジュールの相対的な接触確率が高ければ、それらは相互作用する可能性が高い(サイトより)。
DOCKタブでは、AutoDock VinaまたはDiffDockを使用して低分子リガンドのドッキングについて検証できる。
AutoDock Vinaなどをランするには、ligand nameとsimplified molecular-input line-entry system (SMILES記法) で化合物の構造を記述する必要がある(ランするには権限が必要)。
インターフェイスの詳細はこちらで説明されています。
https://github.com/JBEI/foldy/blob/main/docs/interface.md
引用
Foldy: a web application for interactive protein structure analysis
Jacob B. Roberts, View ORCID ProfileAlberto A. Nava, Allison N. Pearson, Matthew R. Incha, Luis E. Valencia, Melody Ma, Abhay Rao, View ORCID ProfileJay D Keasling
bioRxiv, Posted May 14, 2023.