protein search
2025/08/17 指摘いただいた部分を修正 大量の構造コレクションから、機能的に重要な短い3Dパターンである類似したタンパク質構造モチーフを検出することは、計算上非常に困難である。そこで本著者らは Folddisco を開発した。Folddisco は、側鎖の向きを含む…
2025/05/08 誤字修正 正確なタンパク質構造アライメントは、構造的・機能的関係を理解するために不可欠である。ここでは、GTalign-webを紹介する。GTalignは、空間インデックス駆動型のタンパク質構造アライメントツールである。GTalign-webは、DALIおよびFo…
ProTrekは、配列、構造、自然言語機能(SSF)をシームレスに融合し、先進的なトライモーダル言語モデルにすることで、タンパク質探索を再定義する。対照学習により、ProTrekはタンパク質データと人間の理解とのギャップを埋め、9つのSSFペアワイズモダリティの…
急速に増加するタンパク質配列データベースの進化情報を検索するには、常に高速化が必要である。これは、配列のフィルタリングやギャップアラインメントを実行する革新的なアルゴリズムによって達成される。ここでは、8GPUで最大100TCUPSを達成するギャップ…
アミノ酸配列からのタンパク質フォールド予測における最近のブレークスルーは、新しい構造の洪水を解き放った。タンパク質空間への洞察を広げ、生物工学や治療法への実用化を追求する新たな機会をもたらすと同時に、新たな課題も提示している。それと同時に…
ゲノムおよびメタゲノムの比較は、サンプル間で異なる、または共通する遺伝的エレメントを同定することに依存している。これらの遺伝的エレメントは、シークエンシングリードをアセンブルし、アセンブリ中の遺伝的エレメントを同定することによって、または…
Homologous protein searchは、タンパク質のアノテーションや解析に最もよく使われる手法の一つである。構造検索と比較して、配列のみから遠い進化関係を検出することは依然として困難である。ここでは、配列のみを入力とするHomologous protein searchメソ…
2024/02/026 誤字修正 AlphaFindは、AlphaFold DBの全構造セットにおいて、構造に基づいた高速検索を提供するウェブベースの検索エンジンである。他のタンパク質処理ツールとは異なり、AlphaFindは3次構造に完全に焦点を当てており、各タンパク質鎖の主要な3…
Curated BLAST for Genomesは、目的のゲノム内のプロセスまたは酵素活性の候補遺伝子を見つける。通常、各タンパク質について単一の活性を予測するアノテーションツールとは対照的に、Curated BLASTは、ゲノム中のタンパク質のいずれかが、関連する特性化さ…
タンパク質の構造は、共通の祖先のシグナルを持ち、そのため進化の歴史を再構築するのに役立つ。構造情報推論を迅速に行うために、Structomeというウェブサーバーが開発され、ユーザーはクエリータンパク質に類似した構造を迅速に特定し、構造に基づく系統学…
2023/03/02 プレプリント追記、タイトル修正 wikiより Diamondは、CD-HITやUClustと同様に、ユーザーが定義したクラスタリング基準に基づいて配列をクラスタリングし、セントロイドまたは代表配列のセットを見つけ、クラスタリング基準対セントロイドが満た…
2022/07/12 修正 2023/03/05 追記 2024/05/08 追記 オミックスやメタオミックス技術は、微生物の機能を探索するための強力なアプローチだが、オミックスデータセットの大きさと複雑さにより、その解析はしばしば困難な課題となる。オミックスやメタオミック…
MPI Bioinformatics Toolkit(https://toolkit.tuebingen.mpg.de)(紹介)は、多種多様なパブリックのバイオインフォマティクスツールへのアクセスを無料で提供するインタラクティブなウェブサービスです。30以上の外部ツールと内性ツールを提供しており(2…
アミノ酸配列からタンパク質の機能を予測することは、バイオインフォマティクスの長年の課題である。従来の手法では、配列アライメントを用いて、クエリ配列を何千ものタンパク質ファミリーのモデルや個々のタンパク質配列の大規模データベースと比較する。…
ゲノムデータから目的の遺伝子を同定し、検索することは、多くのバイオインフォマティクスアプリケーションにとって不可欠なステップである。本発表では、プロテオームデータから、クエリプロファイルの隠れマルコフモデル配列アライメントと高い配列類似性…
HPより DASH(Database of Aligned Structural Homologs)は、PDBに登録されている既知の構造的に相同なタンパク質のドメインと鎖の構造アライメントを集めたデータベースである。 その処理方法は、(a) CD-HITを用いてPDBから配列固有のタンパク質を99%の配列…
マイクロバイオームの研究には、通常、特定の環境(biomeとして知られている)からの微生物の集合的な遺伝物質の研究が含まれる。この多様で拡大している研究分野(バイオーム、方法、科学的質問の幅の観点から)は、世界の海洋の深海水と堆積物(1〜3)から…
同じパスウェイ、タンパク質複合体、または同じ環境条件で機能するタンパク質は、系統発生クレード全体で類似した配列保存パターンを示すことがある。特定のタンパク質複合体またはパスウェイをもはや必要としない種では、これらのタンパク質は、グループと…
タンパク質配列の迅速な比較のためのソフトウェアの著者は、そのソフトウェアの速度を評価し、その結果をそのタスクのための最も一般的なソフトウェアと比較しているが、より特殊な用途、例えば、Reciprocal Best Hit(RBH)としてのオルソログの発見のよう…
2020 7/13 タイトル変更 2020 7/14追記 2022/10/19 追記 ゲノミクスやメタゲノミクスプロジェクトのかなりの割合のタンパク質では同定可能なアノテーションされた相同なタンパク質がなく、アノテーションされていないタンパク質がかなりの割合を占めている[r…
現代のDNAシーケンシング技術は、単離した生物のみならず、生物のコレクション(メタゲノミクス)のDNA配列を決定する能力に革命をもたらした。一握りの特徴づけられた配列から新規ゲノムにコードされた遺伝子への自動アノテーションは、特に原核生物ゲノムで…
2020 2/4 追記 UniProtのRetrieve/ID mappingサービスを使用すると、UniProt accessions IDからGenbankの配列、PDBのID、Entrez Gene ID、GI nnumber、タンパク質のアノテーションなどに変換できる。 Converting UniProt identifiers to external identifers…
MPI Bioinformatics Toolkit(https://toolkit.tuebingen.mpg.de)は、タンパク質バイオインフォマティクス分析のための無料のワンストップWebサービスである。現在、相互接続された34の外部ツールと内性ツールを提供しており、その機能には、配列類似性検索…
シーケンスの類似性を検出するためのプロファイル隠れマルコフモデル(HMM)の使用は広く普及している。それらの人気は、いくつかの関連およびアラインされた配列を使用してプロファイルHMMを構築できるという事実に由来し、それを使用して大きなシーケンス…
2019 11/6 タイトル修正、説明追加 重要な生物学的および進化的洞察は、種の系統発生にわたる遺伝子および機能的アノテーションの有無を調査することにより生成できる。これらには、予期しない taxonomic occurrences の特定(ref.1)、遺伝子の進化的起源の…
ゲノムシーケンスは、タンパク質の機能が決定される速度をはるかに超えて、新規タンパク質の発見を加速している(ref,1)。ゲノムシーケンスを解釈し、これらの予測されたタンパク質の役割のアノテーションを付けるには、新規タンパク質と特徴付けられたタン…
UniProt(ref.1)やGenBank(ref.2)などの公共データベースのタンパク質配列の数は、さまざまな大規模ゲノミクスプロジェクト(ref.3〜5)のために急速に増加している。急速な成長により、多くのアプリケーションが代表的なサブセットで動作するようになっ…
近年、シーケンスの数が著しく増加している。これにより、データベース検索(ref.1〜4)がますます長くなり、無料のコンピューティングサービスと事前に計算されたデータベースが閉鎖に追い込まれたりまたは依存するようにクラウドソーシング(ref.5〜7)に…
2021 10/7 論文引用 正確なfunctional annotationを持つタンパク質は、生物学的研究に不可欠である。残念ながら、タンパク質配列の大部分は機能的に特徴付けられていない。つまり、実験的に検証されたアノテーションはない。ハイスループットシーケンスの進…
2019 8/17 タイトル修正 、tips追記 ゲノムデータおよびトランスクリプトームデータに生物学的意味を与えることは、特にハイスループットテクノロジーによって生成される大量のデータと、この目的のために開発されたツール、Webサーバー、およびデータベース…