macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

天然変性タンパク質を予測する ADOPT

 

 天然変性タンパク質(Intrinsically disordered proteins: IDPs)(wiki)は、広範な生物学的機能に重要であり、多くの疾患に関与している。内在性無秩序を理解することは、IDPを標的とする化合物を開発するための鍵となる。IDPの実験的特性解析は、IDPが非常に動的であるという事実によって妨げられている。アミノ酸配列から無秩序を予測する計算手法が提案されている。ここでは、ADOPT(Attention DisOrder PredicTor)を紹介する。ADOPTは、自己教師付きエンコーダーと教師付き無秩序予測器から構成される。前者は深い双方向型のディープトランスフォーマーに基づいており、フェイスブックのEvolutionary Scale Modelingライブラリから高密度の残基レベル表現を抽出する。後者は核磁気共鳴化学シフトのデータベースを使用し、無秩序残基と秩序残基がバランスよく存在するように構築されている。ADOPTは、タンパク質または特定の領域が無秩序であるかどうかを、既存の最良の予測ツールよりも優れた性能で予測し、他のほとんどの提案手法よりも高速に予測する(1配列あたり数秒)。本著者らは予測性能に関連する特徴を特定し、100以下の特徴で既に良好な性能が得られることを示している。ADOPTはスタンドアロンパッケージとしてhttps://github.com/PeptoneLtd/ADOPT、ウェブサーバーとしてhttps://adopt.peptone.io/で利用できる。

 

Github

https://github.com/PeptoneLtd/ADOPT

 

webサービス

https://adopt.peptone.io/にアクセスする。

 

FASTAフォーマットのタンパク質配列を貼り付ける。ここではデモデータを使用(Multiple Fasta)。配列長は750残基以下となっている。

Predict Disorderをクリック。webサービスでは最大10個のタンパク質を同時にサブミットできる。より大規模なプロテオミクス規模の計算にはコマンドライン版を使用する。

 

出力例

2つのタンパク質配列について、各残基のポジションでのZ-scoreがプロットされている。

(論文より)CheZOD Z-scoreは、Chemical shiftに基づき、局所的な無秩序の程度を連続スケールで定量化する(pubmed)。二次Chemical shift、例えば実際の構造とランダムなコイル構造との間の核のChemical shiftの差は、タンパク質の局所的な乱れの正確な指標である。Zスコアスケールは、無秩序の信頼できる尺度であるだけでなく、他の無秩序の尺度ともよく一致することが実証された。1325個のタンパク質を含むCheZODデータベースを拡張し、無秩序残基と秩序残基のバランスのとれた量を保証する方法で計算した全てのZスコアのヒストグラムは、二峰性の分布にフィットする。Zスコアが<3.0の残基は完全に無秩序であると考えられ、3.0 < Z < 8.0は局所的な秩序構造が部分的に形成されているケースに相当する。

 

クエリが1配列の場合、グラフの上にAlphafoldの予測構造も表示される。

 

引用

ADOPT: intrinsic protein disorder prediction through deep bidirectional transformers
Istvan Redl,   Carlo Fisicaro,   Oliver Dutton,   Falk Hoffmann,   Louie Henderson, Benjamin M J Owens,   Matthew Heberling,   Emanuele Paci,   Kamil Tamiola
NAR Genomics and Bioinformatics, Volume 5, Issue 2, June 2023

 

コロナ禍の混乱も落ち着いてきて今年こそは少しでも穏やかな年になればと思っていましたが、 とてもそのような状況ではありません。被災された方々のご無事と、1日も早く元の生活に戻れることを祈っています。