微生物の増殖曲線をインタラクティブに解析するウェブアプリケーション Dashing Growth Curves

微生物の成長を記録し分析することは、ライフサイエンスにおける日常的な作業である。数十から数百の増殖曲線を同時に記録するマイクロプレートリーダーは、この作業にますます使用されるようになり、その迅速で信頼性の高い分析に対する需要が高まっている…

2024-04-25

細菌の保存されたタンパク質の割合を計算するためのNextflowパイプライン POCP-nf

2024 Bioinformatics nextflow POCP

シーケンス技術の進歩により、細菌ゲノムは飛躍的に増加しており、確実な分類法が必要とされている。Qin et al. (2014)によって最初に提案されたPercentage Of Conserved Proteins (POCP)は、原核生物の属境界を評価するための貴重な指標である。ここでは、…

2024-04-24

メタゲノムアセンブリの高精度なbin refinementツール Binette

2024 Preprint Binning (metagenomics) metagenome

2024/04/24 誤字修正メタゲノム解析は、ショットガンシーケンスによる微生物群集とその個々のメンバーの研究を可能にする。メタゲノム解析に不可欠な段階は、メタゲノムアセンブリゲノム（MAG）の回収である。メタゲノム解析では、シーケンスリードをコンテ…

2024-04-22

複雑な反復配列を迅速にインタラクティブなドットプロットで可視化する ModDotPlot

2024 Preprint dot plot web tool 結果の視覚化 (visualization) 高速なツール centromere tandem repeats

ゲノムの反復配列を分析する一般的な方法は、ドットプロットによって可視化された配列類似性マトリックスを作成することである。StainedGlassのような革新的なアプローチは、ドットプロットを配列同一性のヒートマップとしてレンダリングすることにより、こ…

2024-04-21

（ヒトとマウス）仮説生成のためにクエリに最も類似した遺伝子発現シグネチャーを検索する RummaGEO

2024 Preprint GEO human whole genome mouse RNA seq web tool GPT

Gene Expression Omnibus (GEO)は、トランスクリプトミクスやその他のオミックスデータセットのための主要なオープンな生物医学研究リポジトリである。現在、世界中の多くの生物医学研究ラボによって収集された数万件の研究から得られた数百万件の遺伝子発現…

2024-04-20

FastQCの高速な代替 Falco

F1000Research 2019 trimming / preprocessing 高速なツール

品質管理はシーケンスデータ解析において不可欠な最初のステップであり、品質管理のためのソフトウェアツールはほとんどのシーケンスセンターで標準的なパイプラインに深く浸透している。関連する計算は簡単だが、多くの環境では品質管理に必要な総計算量は…

2024-04-19

KEGG KOデータベースでKO IDの機能的情報を取得する

KEGG KEGG pathway tips

タイトルの通りです。KO (KEGG Orthology) のリストから情報を取得するには、KO (KEGG ORTHOLOGY) Databaseのトップページにアクセスするのが手っ取り早いです。 https://www.genome.jp/kegg/ko.htmlにアクセスする。 KO IDを入力する。手持ちのKO IDのタイ…

2024-04-19

NCBI SRAで検索する時のtips

NCBI tips SRA

NCBI SRAでは公開されているシークエンシングデータを検索し、必要であればダウンロードできる。 metagenomeと検索してみると4,566,384件ヒットした（2024年4月実行）。 metagenomeと検索したが、16Sがタイトルに含まれるシークエンシングデータがトップヒッ…

2024-04-17

WGSやRNA-seqやTarget-captureなどのさまざまなショートリードデータからユーザーが指定した数百〜数千の遺伝子座の同祖配列を抽出し、系統解析に使用可能なMSAを出力する CAPTUS

Preprint Chloroplast DNA (plastome) phylogenetic marker genes phylogenetic tree Inference mitochondria automated pipeline multiple sequence alignment (MSA) 系統解析分子系統樹 2023

ターゲットキャプチャー、RNA-Seq、ゲノムスキミング、深く読んだ全ゲノムシーケンスなど、多様なハイスループットシーケンスデータは系統ゲノム解析に利用されているが、このようなミックスされたデータを単一の系統ゲノムデータセットに統合するには、多く…

2024-04-15

GO termからタンパク質の機能的要約を生成する GO2Sum

2024 npj Systems Biology and Applications GO term

タンパク質の生物学的機能を理解することは、現代の生物学において基本的に重要である。タンパク質の機能を表現するために、制御された語彙であるGene Ontology (GO)は、オープンエンドなテキスト解釈を避け、コンピュータプログラムで扱いやすいため、頻繁…

2024-04-13

（ヒト）AlphaFoldでモデル化されたタンパク質間相互作用のデータベース Predictomes

Protein-protein interactions (PPIs) human genome 2024 Preprint AlphaFold

タンパク質間相互作用(PPI)は生物学において普遍的なものであるが、生化学的プロセスの根底にあるPPIの包括的な構造解析は不足している。AlphaFold-Multimer(AF-M)はこの知識のギャップを埋める可能性を秘めているが、標準的なAF-Mの信頼性指標では、関連す…

2024-04-12

メタゲノムアセンブリからのターゲットとするウイルスゲノムの完全性と連続性を向上させる COBRA

2024 Nature Microbiology Viruses assembly

ウイルスの研究はメタゲノムシークエンシングを用いて行われることが多いが、ゲノムの不完全性が包括的で正確な解析の妨げとなっている。Contig Overlap Based Re-Assembly (COBRA)は、de Bruijnグラフに基づいてアセンブリのブレークポイントを解決し、コン…

2024-04-12

タンパク質言語モデルにより正確で高速なリモート相同性配列検索を行う PLMSearch

Protein language model protein search 2024 Nature Communications web tool

Homologous protein searchは、タンパク質のアノテーションや解析に最もよく使われる手法の一つである。構造検索と比較して、配列のみから遠い進化関係を検出することは依然として困難である。ここでは、配列のみを入力とするHomologous protein searchメソ…

2024-04-11

タンパク質構造へのバリアントのマッピングのためのコマンドラインツール 3Dmapper

2024 Bioinformatics AlphaFold mapping variant structural aligners

ゲノムデータの解釈は、生物学的プロセスの分子メカニズムを理解する上で極めて重要である。タンパク質構造は、遺伝子をコードする変異体に機能的な背景を与えることにより、この解釈を容易にする上で重要な役割を果たす。しかし、遺伝子とタンパク質の対応…

2024-04-08

細菌のpopulation genomicsのためのインタラクティブなビューア Phandango

2018 Bioinformatics web tool population genomics bacteria

現在の細菌集団ゲノミクスのデータセットに含まれる豊富なデータを十分に活用するには、数百から数千の分離株における数百万塩基対にわたるさまざまなタイプの解析を統合し、統合する必要がある。現在のアプローチでは、系統学的、疫学的、統計学的、進化学…

2024-04-07

生物医学ナリッジを紐解くためのAI駆動文献リソース PubTator 3.0

2013 2019 2024 Nucleic Acids Research インフォマティクス解析をサポートするツール text mining

PubTator 3.0（https://www.ncbi.nlm.nih.gov/research/pubtator3/）は、タンパク質、遺伝子バリアント、疾患、化学物質のような主要な概念の意味と関係性の検索を提供する最先端のAI技術を用いた生物医学文献リソースである。現在、約3600万件のPubMed abst…