2025/05/08 誤字修正
正確なタンパク質構造アライメントは、構造的・機能的関係を理解するために不可欠である。ここでは、GTalign-webを紹介する。GTalignは、空間インデックス駆動型のタンパク質構造アライメントツールである。GTalign-webは、DALIおよびFoldseekサーバーとのベンチマークにより、迅速な検索時間を維持しながら、優れた精度を実証している。GTalign-webの有用性は、UniRef30に対する検索を通して、未同定タンパク質のアノテーションにおいてさらに強調されている。GTalign-webはタンパク質の構造解析や機能アノテーションに有用なリソースを提供し、https://bioinformatics.lt/comer/gtalignで利用できる。このウェブサイトは無料で全てのユーザーに公開されており、ログインの必要はない。
Tutorial
https://bioinformatics.lt/comer/gtalign/tutorial
https://bioinformatics.lt/comer/gtalign/にアクセスする。
問い合わせる構造を貼り付けるか、ent[.gz]、.pdb[.gz]、.cif[.gz]のいずれかの拡張子のファイルとしてアップロードする。複数のファイルをアップロードすることも可能となっている。複数のクエリ構造は個々の構造ファイルを含む.tarファイルとしてアップロードすることにも対応している。

ファイルサイズの合計は10 MB
データベースを指定する。デフォルトはPDB mmCIF、RCSB PDB(構造解析済みの構造)、SCOPe、ECOD、Uniprotなど選べる(それぞれクラスタリングしきい値が異なり異なるレベルで冗長性が除去されている)。

Search and alignment options を展開すると、最小TMスコア、ソートオプション、構造/配列類似性フィルターなど追加のパラメーター調整ができる。

サブミットする。
ジョブの進捗はステータスで監視できる。

ジョブが完了すると、各クエリチェーンおよび/またはモデルの個々の結果ページへのリンクが表示される。テスト時は1分ほどで結果のリンクが表示された。
出力例
クエリと類似した構造のペアワイズ構造アラインメントを示すスキマティックアラインメントが表示される。アラインメントは、サブミット前の選択されたソート順にTM-score値に従って色分けされている(下の写真では赤だけだが、整列状態が弱いと別の色になる)。アライメントまたは表のIDをクリックすると、対応するペアワイズアライメントにジャンプする。

各クエリについて、結果の要約と詳細な表が表示される。

表の下には、全ヒットについて二次構造要素を視覚的に表現した構造アラインメントが表示される。

アラインメントの上下のSSの行は
h: アルファヘリックス
e: ベータ鎖
t: ターン
を表す。

アラインメントの上にはアラインメント統計の表も表示されている。リファレンスとクエリのTMスコア(長さ正規化)、一致しないヘリックスを考慮した2TMスコア。
RMSD、同一性パーセンテージ、アラインされた残基数など(マニュアルより)。
個々のaccession protein IDをクリックすると、PDBの場合はPDBの該当する構造のページにジャンプする。

表の右端のsuperpositionをクリックすると、クエリとヒットした構造の重ね合わせを可視化してインタラクティブに操作できる。

選択したペアワイズアラインメントに基づいてMSAを可視化できる。構造を左のボックスから選択し、Construct MSAをクリックする。

生成されたMSAはインタラクティブに操作できる。

結果は左上からJSON形式でダウンロードできる。

その他(論文より)
- GTalign-webは、スピードと精度を重視して設計されており、様々な形式の複数のクエリ構造に対するタンパク質構造アライメントをサポートしている。
- タンパク質構造アライメントには、最適な重ね合わせ、すなわち、残基間の距離を最小にしながら、アライメントされた残基の数を最大にする、という重要な計算上の課題がある。DALI、SSAP、CE、MAMMOTH、LGA、TM-alignなどの既存のツールは大きな貢献をしているが、大規模なデータセットに適用すると計算量が膨大になる。最近のアプローチの中には、あらかじめクラスタ化された構造データベースを活用して検索を高速化するものもあるが、非常に大規模なデータセットでは計算性能の限界が残る。逆に、スピード[15]に最適化されたツールは、生物学的に重要な構造の類似性に対する感度を犠牲にすることが多く、進化的・機能的関係を見落とす可能性がある。このトレードオフの関係から、効率と精度の両方を達成するタンパク質構造アライメントツールの重要性が浮き彫りになるGTalignは、高精度と高速性を兼ね備えた、空間インデックス駆動型の新しいタンパク質構造アライメントツールである。
引用
Web-based GTalign: bridging speed and accuracy in protein structure analysis
Justas Dapkūnas , Mindaugas Margelevičius
Nucleic Acids Research, Published: 07 May 2025
GTalign: spatial index-driven protein structure alignment, superposition, and search
Mindaugas Margelevičius
Nature Communications volume 15, Article number: 7305 (2024)
関連
