膜貫通タンパク質の統合リソース UniTmp

UNIfied database of TransMembrane Proteins (UniTmp)は、膜貫通タンパク質の構造情報を、タンパク質セグメントの局在、タンパク質のトポロジーから膜包埋3次元構造まで、様々なレベルで網羅的に収集した、自由にアクセス可能なリソースである。何万もの新…

2024-02-07

in silicoタンパク質間相互作用予測のためのユーザーフレンドリーなパイプライン LazyAF

2024 Preprint protein-protein interaction (PPI) google colab AlphaFold

2024/02/07 タイトル変更人工知能はタンパク質構造予測の分野に革命をもたらした。しかし、より強力で複雑なソフトウェアが開発されるにつれ、エンドユーザーにとって制限要因になりつつあるのは、能力よりもむしろアクセシビリティと使いやすさである。こ…

2024-02-03

大規模微生物データセットのためのスケーラブルなコアゲノムアライメント Parsnp 2.0

高速なツール 2024 Preprint phylogenetic tree Inference

2016年以降、NCBIでリファレンスゲノムが利用可能な微生物種の数は3倍以上に増えている。Multiple genome alignmentは、共通の祖先を共有する複数のゲノムのヌクレオチドを特定するプロセスであり、多くの下流の比較解析手法の入力として使用される。Parsnp…

2024-02-01

高速・高感度タンパク質配列アノテーション用ソフトウェア nail

2024 Preprint HMM 高速なツール annotation

新たに塩基配列が決定された生物の多様性は極めて高く、最新の配列データベースは非常に大規模であるため、配列アノテーションにおける感度とスピードという相反するニーズの間で緊張関係が生じている。プロファイル隠れマルコフモデル(pHMM)に基づくアライ…

2024-01-31

塩基配列アラインメント用ライブラリ BSAlign

2024 Preprint

塩基配列アライメントの精度を高めることはゲノム研究において必須の課題である。古典的な動的プログラミングアルゴリズム（Smith-WatermanやNeedleman-Wunschなど）は最適な結果を出すことを保証しているが、その時間の複雑さが大規模配列アライメントへの…

2024-01-31

De novoで散在性反復配列を検出する REPrise

2024 Preprint repetitive sequences large genome

真核生物ゲノムの大部分を占める反復配列の正確なアノテーションは、様々なゲノム解析に不可欠である。データベースフリーのde novoリピート検出アプローチは、十分にキュレートされたリピートデータベースがないゲノムのアノテーションに威力を発揮する。し…

2024-01-25

タンパク質配列中の疎水性モジュール性を視覚的に探索するBlobulatorのウェブツール

2024 Preprint disordered proteins web tool

疎水性残基のクラスターは構造を取っているタンパク質の安定性を促進し、タンパク質の凝集（aggregation）を促進することが知られている。最近の研究で、連続した疎水性残基クラスター（"blob "と呼ばれる）を同定することが、内在性無秩序タンパク質（IDP）…

2024-01-20

表現学習に基づくビニング法 COMEBin

2024 Nature Communications Binning (metagenomics) metagenome

コンティグビニングは、メタゲノムデータ解析において、同一または近縁ゲノムからのコンティグをグループ化することで重要な役割を果たしている。しかし、既存のビニング手法は、データの種類が多様であることや、異種情報を効率的に統合することが困難であ…

2024-01-18

近傍した遺伝子の大規模解析、比較、可視化を行う AnnoView

2024 Preprint GTDB web tool gene cluster KEGG PFAM TIGRFAM archaea bacteria Viruses plasmid

遺伝子近傍の解析と比較は、微生物ゲノムの構造、機能、進化を探索するための強力なアプローチである。ゲノムの可視化や比較のためのツールは数多く存在するが、大規模なゲノムデータベースやユーザーが作成したデータセットを横断してゲノムを探索すること…

2024-01-16

（ヒト）遺伝子スクリーニングの結果をタンパク質の配列と構造にリンクする Genomics 2 Proteins portal

2024 Preprint AlphaFold clinical and diagnostic protein domain variant ranking web tool Human Phenotype Ontology (HPO) human de novo mutation human genome structure viewer

近年のAIを用いた手法の進歩は、構造生物学の分野に革命をもたらした。それと同時に、ハイスループットシークエンシングと機能的ゲノミクス技術により、バリアントの検出と生成がかつてない規模で可能になった。しかし、バリアントをタンパク質構造に「マッ…

2024-01-15

ウルトラロングデータセットに対する高速多重塩基配列アラインメント法 FMAlign2

2024 Bioinformatics multiple sequence alignment (MSA) 高速なツールテスト失敗

バイオインフォマティクスにおいて、マルチプル配列アライメント（MSA）は極めて重要なタスクである。しかし、従来の方法では、ウルトラロングシークエンスのアライメントに苦労することが多い。この問題に対処するため、研究者たちは、並列アラインメントの…

2024-01-06

タンパク質コードDNAの高感度かつエラー耐性アノテーションを行う BATH

2024 Preprint HMM 高速なツール

BATHは、タンパク質配列のデータベースまたはプロファイル隠れマルコフモデル（pHMM）へのDNAの直接アラインメントに基づく、タンパク質をコードするDNAの高感度アノテーションツールである。BATHはHMMER3コードベース上に構築されており、わかりやすい入力…

2023-07-23

minimizer空間でメタゲノムのアセンブリを行う metaMDBG

2023 Preprint metagenome Pacbio polish GFA dereplication Nature Biotechnology 2024

2023/08/03 全面的に修正 2024/01/03 論文引用、タイトル修正高精度ロングリードのための新しいメタゲノミクスアセンブラを紹介する。metaMDBGとして実装された本アプローチは、minimizer空間における高効率なde Bruijnグラフアセンブリと、ゲノムカバレッ…

2023-07-21

遺伝子アノテーションの品質評価を行う OMArk

Preprint 2022 eukaryotic genome annotation evaluation tool web tool テスト失敗 2024 Nature Biotechnology

多様な生物種のゲノム配列がますます豊富になる時代において、タンパク質をコードする遺伝子レパートリーの質を評価することは極めて重要である。最先端のゲノムアノテーション評価ツールは、遺伝子レパートリーの完全性を測定するが、遺伝子の過剰予測やコ…

2023-02-26

2 つのアセンブリ間のアライメントを比較するNCBIの Comparative Genome Viewer

NCBI synteny_block 結果の視覚化 (visualization) 2024 PLOS Biology

2024/05/09 論文追記 NCBI Insightsより NCBIのComparative Genome Viewer (CGV)では、2 つのアセンブリ間のアライメントを表示および比較し、欠失、逆位、転座を含むゲノム配列および構造の違いを確認することができます。 NCBIのComparative Genome Viewer…

2022-09-15

全自動のトランスポーザブル・エレメントのアノテーションと解析のパイプライン Earl Grey

2022 Preprint repetitive sequences automated pipeline 結果の視覚化 (visualization) 2024 Molecular Biology and Evolution

2024/04/06 論文追記トランスポーザブル・エレメント（TE）は、ほぼ全ての真核生物ゲノムに存在し、様々な進化過程に関与している。TEに関する研究は非常に盛んだが、そのアノテーションと特性解析は、特に非専門家にとって依然として困難である。(i)断片的…

2022-07-03

バクテリオファージの標準的なアノテーションを行う pharokka

phage annotation 2024 Bioinformatics

2024/01/12 論文引用 Gitrhubより pharokkaはバクテリオファージの標準的なアノテーションを迅速に行うために設計されています。簡単に説明すると、遺伝子予測はPHANOTATE (https://github.com/deprekate/PHANOTATE) を、機能アノテーションはPHROGsデータベ…

2022-06-07

ロングリードのアセンブラ NextDenovo

Nanopore long read Pacbio assembly 高速なツール polish 2024 Genome Biology

2022/06/09 追記 2024/04/28 論文追記 Githubより NextDenovoは、ロングリード（CLR、HiFi、ONT）用のストリンググラフベースのde novoアセンブラです。canuと同様に "correct-then-assemble "戦略を採用していますが（PacBio HiFiリードは修正ステップなし…