タンパク質構造のモチーフを超高速に検索する Folddisco

2025/08/17 指摘いただいた部分を修正大量の構造コレクションから、機能的に重要な短い3Dパターンである類似したタンパク質構造モチーフを検出することは、計算上非常に困難である。そこで本著者らは Folddisco を開発した。Folddisco は、側鎖の向きを含む…

2025-05-08

webベースのタンパク質構造アライメントツール Web-based GTalign

2025 Nucleic Acids Research Nature Communications 2024 web tool PDB structural aligners protein search multiple sequence alignment (MSA) UniProt

2025/05/08 誤字修正正確なタンパク質構造アライメントは、構造的・機能的関係を理解するために不可欠である。ここでは、GTalign-webを紹介する。GTalignは、空間インデックス駆動型のタンパク質構造アライメントツールである。GTalign-webは、DALIおよびFo…

2025-02-19

ProTrek

2024 protein search Preprint Marine Metagenomics PLM eukaryotic genome annotation enzyme function 高速なツール

ProTrekは、配列、構造、自然言語機能(SSF)をシームレスに融合し、先進的なトライモーダル言語モデルにすることで、タンパク質探索を再定義する。対照学習により、ProTrekはタンパク質データと人間の理解とのギャップを埋め、9つのSSFペアワイズモダリティの…

2025-01-18

GPUによる高速相同性検索に対応した MMseqs2

2024 高速なツール GPU protein search Preprint benchmark

急速に増加するタンパク質配列データベースの進化情報を検索するには、常に高速化が必要である。これは、配列のフィルタリングやギャップアラインメントを実行する革新的なアルゴリズムによって達成される。ここでは、8GPUで最大100TCUPSを達成するギャップ…

2024-06-25

タンパク質構造検索・アライメントアルゴリズム Reseek

2024 Preprint protein search all versus all sequence comarison PDB 高速なツール

アミノ酸配列からのタンパク質フォールド予測における最近のブレークスルーは、新しい構造の洪水を解き放った。タンパク質空間への洞察を広げ、生物工学や治療法への実用化を追求する新たな機会をもたらすと同時に、新たな課題も提示している。それと同時に…

2024-06-06

生のメタゲノムシークエンシングリードからターゲットのタンパク質を読んだリードを同定する Lapidary

2024 Preprint protein search BLAST metagenome

ゲノムおよびメタゲノムの比較は、サンプル間で異なる、または共通する遺伝的エレメントを同定することに依存している。これらの遺伝的エレメントは、シークエンシングリードをアセンブルし、アセンブリ中の遺伝的エレメントを同定することによって、または…

2024-04-12

タンパク質言語モデルにより正確で高速なリモート相同性配列検索を行う PLMSearch

Protein language model protein search 2024 Nature Communications web tool PLM

Homologous protein searchは、タンパク質のアノテーションや解析に最もよく使われる手法の一つである。構造検索と比較して、配列のみから遠い進化関係を検出することは依然として困難である。ここでは、配列のみを入力とするHomologous protein searchメソ…

2024-02-24

既知のプロテオーム空間から類似したタンパク質構造を発見する AlphaFind

2024 Preprint AlphaFold web tool PDB protein search UniProt

2024/02/026 誤字修正 AlphaFindは、AlphaFold DBの全構造セットにおいて、構造に基づいた高速検索を提供するウェブベースの検索エンジンである。他のタンパク質処理ツールとは異なり、AlphaFindは3次構造に完全に焦点を当てており、各タンパク質鎖の主要な3…

2024-02-09

キュレーションされたBLASTサービス Curated BLAST

2019 mSystems (Journal) BLAST protein search web tool annotation

Curated BLAST for Genomesは、目的のゲノム内のプロセスまたは酵素活性の候補遺伝子を見つける。通常、各タンパク質について単一の活性を予測するアノテーションツールとは対照的に、Curated BLASTは、ゲノム中のタンパク質のいずれかが、関連する特性化さ…

2023-02-24

タンパク質の構造的近傍を探索する Structome

2023 Preprint protein search web tool

タンパク質の構造は、共通の祖先のシグナルを持ち、そのため進化の歴史を再構築するのに役立つ。構造情報推論を迅速に行うために、Structomeというウェブサーバーが開発され、ユーザーはクエリータンパク質に類似した構造を迅速に特定し、構造に基づく系統学…

2023-02-10

タンパク質配列データベースをクラスタリングするDiamondのclusterコマンド (DIAMOND DeepClust)

protein search sequence clustering 2023

2023/03/02 プレプリント追記、タイトル修正 wikiより Diamondは、CD-HITやUClustと同様に、ユーザーが定義したクラスタリング基準に基づいて配列をクラスタリングし、セントロイドまたは代表配列のセットを見つけ、クラスタリング基準対セントロイドが満た…

2022-07-10

UniProtのデータベースから機能的アノテーションとID mappingを行う UPIMAPI

Computational and Structural Biotechnology Journal 2022 UniProt download protein search annotation ID mapping

2022/07/12 修正 2023/03/05 追記 2024/05/08 追記オミックスやメタオミックス技術は、微生物の機能を探索するための強力なアプローチだが、オミックスデータセットの大きさと複雑さにより、その解析はしばしば困難な課題となる。オミックスやメタオミック…

2022-04-20

MPI Bioinformatics ToolkitのPSI-BLASTサービス

BLAST HMM AlphaFold multiple sequence alignment (MSA) protein search

MPI Bioinformatics Toolkit（https://toolkit.tuebingen.mpg.de）（紹介）は、多種多様なパブリックのバイオインフォマティクスツールへのアクセスを無料で提供するインタラクティブなウェブサービスです。30以上の外部ツールと内性ツールを提供しており（2…

2022-04-13

アミノ酸配列からググってタンパク質の機能を調べる ProteInfer

GO term protein search 2021 Preprint deep neural network

アミノ酸配列からタンパク質の機能を予測することは、バイオインフォマティクスの長年の課題である。従来の手法では、配列アライメントを用いて、クエリ配列を何千ものタンパク質ファミリーのモデルや個々のタンパク質配列の大規模データベースと比較する。…

2022-01-19

遺伝子同定と検索を自動化するための広範に適用可能なツール orthofisher

G3: Genes, Genomes, Genetics 2021 HMM orthologue protein search

ゲノムデータから目的の遺伝子を同定し、検索することは、多くのバイオインフォマティクスアプリケーションにとって不可欠なステップである。本発表では、プロテオームデータから、クエリプロファイルの隠れマルコフモデル配列アライメントと高い配列類似性…

2021-10-10

DASHデータベース

2019 Nucleic Acids Research PDB protein search database

HPより DASH(Database of Aligned Structural Homologs)は、PDBに登録されている既知の構造的に相同なタンパク質のドメインと鎖の構造アライメントを集めたデータベースである。その処理方法は、(a) CD-HITを用いてPDBから配列固有のタンパク質を99%の配列…

2021-07-17

マイクロバイオーム解析リソース MGnify

2019 Nucleic Acids Research metagenome Marine Metagenomics HMM web tool protein search

マイクロバイオームの研究には、通常、特定の環境（biomeとして知られている）からの微生物の集合的な遺伝物質の研究が含まれる。この多様で拡大している研究分野（バイオーム、方法、科学的質問の幅の観点から）は、世界の海洋の深海水と堆積物（1〜3）から…

2020-11-02

異なるphylogenetic cladesで保存されているタンパク質を検索するwebサービス PhyloGene

2015 Nucleic Acids Research heatmap web tool protein search orthologue

同じパスウェイ、タンパク質複合体、または同じ環境条件で機能するタンパク質は、系統発生クレード全体で類似した配列保存パターンを示すことがある。特定のタンパク質複合体またはパスウェイをもはや必要としない種では、これらのタンパク質は、グループと…

2020-10-11

（プロテイン）レシプロカルベストヒットを抽出する getRBH.pl

2020 Preprint ANI protein search reciprocal best hit

タンパク質配列の迅速な比較のためのソフトウェアの著者は、そのソフトウェアの速度を評価し、その結果をそのタスクのための最も一般的なソフトウェアと比較しているが、より特殊な用途、例えば、Reciprocal Best Hit（RBH）としてのオルソログの発見のよう…

2020-07-12

高感度な類似タンパク質配列検索ツール HH-suite3（hhblitsについて）

2019 BMC Bioinformatics protein search 高速なツール multiple sequence alignment (MSA)

2020 7/13 タイトル変更 2020 7/14追記 2022/10/19 追記ゲノミクスやメタゲノミクスプロジェクトのかなりの割合のタンパク質では同定可能なアノテーションされた相同なタンパク質がなく、アノテーションされていないタンパク質がかなりの割合を占めている[r…

2020-02-09

Genome properties (GP)

2019 Nucleic Acids Research web tool protein search database bacteria protein domain Pathway HMM phenotype

現代のDNAシーケンシング技術は、単離した生物のみならず、生物のコレクション(メタゲノミクス)のDNA配列を決定する能力に革命をもたらした。一握りの特徴づけられた配列から新規ゲノムにコードされた遺伝子への自動アノテーションは、特に原核生物ゲノムで…

2020-01-30

UniprotのID変換webサービスを使い、UniProt accessionsからタンパク質のアノテーションを得る (ID mapping)

phage taxonomy ID tips web tool Gene ID Conversion protein search UniProt ID mapping

2020 2/4 追記 UniProtのRetrieve/ID mappingサービスを使用すると、UniProt accessions IDからGenbankの配列、PDBのID、Entrez Gene ID、GI nnumber、タンパク質のアノテーションなどに変換できる。 Converting UniProt identifiers to external identifers…

2020-01-25

MPI Bioinformatics ToolkitのHHpredとMODELLER webサービス

Journal of Molecular Biology 2018 HMM protein search proteome web tool BLAST

MPI Bioinformatics Toolkit（https://toolkit.tuebingen.mpg.de）は、タンパク質バイオインフォマティクス分析のための無料のワンストップWebサービスである。現在、相互接続された34の外部ツールと内性ツールを提供しており、その機能には、配列類似性検索…