MPI Bioinformatics Toolkit(https://toolkit.tuebingen.mpg.de)(紹介)は、多種多様なパブリックのバイオインフォマティクスツールへのアクセスを無料で提供するインタラクティブなウェブサービスです。30以上の外部ツールと内性ツールを提供しており(2020年の論文時点で35個)、その機能には、配列類似性検索、アライメント構築、配列の特徴検出、構造予測、配列分類が含まれます。機能の幅広さや使いやすさから、MPI Bioinformatics Toolkitは生命科学分野の重要なリソースとなっています。
最近のアップデートで、選択可能なデータベースの中にAlphaFold DB(link)が追加され、AlphaFold DB (FTP) のタンパク質へのPSI-BLASTが行えるようになりました(注;タンパク質配列への通常のPSI-BLASTサーチです)。簡単に使い方を確認しておきます。
8/27
We have included the full @emblebi @DeepMind AlphaFold/UniProt protein sequence database (alphafold_uniprot) and a filtered version of it (alphafold_uniprot50) as target databases for PSI-BLAST, HMMER, and PatternSearch. pic.twitter.com/60zscrSBow
— MPI Bioinformatics Toolkit (MPI for Biology) (@mpitoolkit) 2022年8月27日
4/18
We have included #AlphaFoldDB from @DeepMind @emblebi as a target database for PSI-BLAST (https://t.co/7Q4HBEOPNu). pic.twitter.com/hVh8I2TkCx
— MPI Bioinformatics Toolkit (MPI for Biology) (@mpitoolkit) April 18, 2022
https://toolkit.tuebingen.mpg.de/tools/psiblastにアクセスしてSearchタブを選択します。
ProtBLAST/PSI-BLASTを選択します。
データベースをalphafolddb_v2に切り替えます。
タンパク質配列を入力。
パラメータを確認してサブミットします。
出力例
それぞれのヒットをクリックするとアラインメントにジャンプします。
E-Value Plot
MSAからは多重配列整列ファイルをダウンロードできます。
引用
Protein Sequence Analysis Using the MPI Bioinformatics Toolkit
Felix Gabler, Seung-Zin Nam, Sebastian Till, Milot Mirdita, Martin Steinegger, Johannes Söding, Andrei N Lupas, Vikram Alva
Curr Protoc Bioinformatics. 2020 Dec;72(1):e108
参考
関連
興味深いツイートがあったので貼っておきます。
Hive mind-- i have a protein of unknown function, no good blast hits to anything. what would you do (computationally) to get hints of function?
— Andrew Kern (@pastramimachine) April 21, 2022