ゲノムアノテーションとゲノム多様性解析のためのオールインワンワークフロー EASYstrata

生命のツリー全体にわたって新たなリファレンスゲノムとトランスクリプトームがますます利用可能になり、刺激的な疑問に取り組む新たな道が開かれている。しかしながら、ゲノムのアノテーションと進化プロセスの推論には依然として課題があり、方法論の標準…

2026-01-20

細菌ゲノムの新規アノテーションのための統合プラットフォーム BacExplorer

2025 Bioinformatics Advances Pathogen Bacterial infections bacterial annotation windowsツール AMR テスト失敗 GUIツール

ハイスループットシーケンシング（HTS）は、微生物学者の日常的な分析に不可欠な要素となっている。数十のサンプルをシーケンシングするプロセスでは、手作業ではアノテーションを付与できない膨大な量のデータが生成される。この課題に対処するため、長年に…

2026-01-17

完全に自動化された 16S･18Sメタアンプリコン解析パイプライン AmpWrap

2025 amplicon sequence Bioinformatics Advances ASV (amplicon sequence variant) Nanopore long read snakemake automated pipeline

次世代シーケンシング革命は、群集構成を探索するための効率的かつ費用対効果の高い方法としてメタバーコーディングの確立を推進した。原核生物の16S rRNA遺伝子などの分類マーカー遺伝子のアンプリコンシーケンシングは、ハイスループット分類プロファイリ…

2026-01-14

軽量かつインタラクティブなアライメントの視覚化を行う Alignoth

2025 Bioinformatics bam/sam 結果の視覚化 (visualization)

Alignothは、DNAシーケンシングリードアライメントパイルアップの自己完結型でポータブルなHTMLレポートを生成する軽量コマンドラインアプリケーションである。PNG、SVG、PDFなどの静的フォーマットやJSONベースの埋め込み可能な形式へのエクスポートもサポ…

2026-01-08

大規模データにおいて形質の進化的関連性を調べる SimPhyNI

2025 Preprint microbial GWAS GWAS snakemake

ゲノム特徴と形質の間、またはゲノム形質のペア間の関連性を識別する従来の方法は、細菌ゲノムに適用すると困難をきたす。細菌におけるゲノムワイド連鎖が強い進化誘導関連性を生み出すという事実を説明するために、いくつかの微生物GWAS（mGWAS）法が開発さ…

2026-01-05

マルチスケール適応型クラスタリングと評価によるメタゲノムロングリードの効率的なビニングを行う LorBin

2025 Nature Communications Binning (metagenomics) Pacbio Nanopore long read

ロングリードシーケンスはメタゲノミクスを変革し、メタゲノムアセンブルゲノム（MAG）の品質を向上させた。しかし、現在のビニング手法では、未知の種の同定や不均衡な種分布の管理が課題となっている。本稿では、天然マイクロバイオーム中のMAGを再構築す…

2026-01-04

シンテニープロット解析前のクオリティコントロールを行う SyntenyQC

2025 Bioinformatics synteny_block

SyntenyQCは、シンテニープロットを構築するためのデータ前処理ツールである。ゲノムデータの収集、アノテーション、デレプリケーションをサポートし、有益なシンテニープロットの構築を容易に（場合によっては根本的に）実現する。 SyntenyQCは、Pythonバー…

2026-01-03

８つの生物種におけるオルソログ起源情報を提供する OrthoGuide

2025 2024 Molecular Biology and Evolution COG

オーソロジーは、代謝経路や遺伝子制御ネットワークといった生物システムの進化研究において、貴重な代替指標であることが証明されている。同じオーソロググループに属する遺伝子は、通常、共通の祖先を反映して、同じ進化史を共有している。この特性を活用…

2026-01-03

ゲノム近傍を解析するwebサービス GNAT

2025 Preprint web tool gene cluster operon

Gene Neighbourhood Analysis Tool（GNAT）は、タンパク質配列を与えられた微生物（細菌、古細菌、真菌）またはウイルスデータベース内の相同遺伝子を同定し、それらのゲノム近傍（GN）を類似性に基づいてアラインメントおよびクラスタリングし、一致したゲ…

2026-01-02

細胞外多糖類生合成遺伝子クラスターを発見する epsSMASH

2025 web tool gene cluster exopolysaccharide secondary metabolites

バイオフィルムは、自然環境および人工環境における細菌のデフォルトの生活様式を表し、細胞外多糖類（exoPS）はバイオフィルムマトリックスの重要な構造的および機能的構成要素として機能する。その重要性にもかかわらず、これらの環境でのexoPSの産生はほ…

2025-12-04

ロングリードの事前フェーシングでSVジェノタイピングを改善する SVUPP

2025 Bioinformatics

ここでは、リードのフェージング情報を遺伝子型尤度に組み込むことでSVの遺伝子型判定を改善する手法SVUPPを提案する。包括的なベンチマーク評価により、SVUPPは近傍にSVが存在しない場合のSV遺伝子型判定において、オックスフォード・ナノポア・テクノロジ…

2025-11-14

シード遺伝子からオルソログを高速探索できる fDOG

Molecular Biology and Evolution 2025 orthologue

植物材料の分解は地球規模の炭素循環の主要な推進力であり、従来は菌類や細菌に起因すると考えられてきた。しかし、一部の無脊椎動物も、水平遺伝子移動によって獲得された可能性のある、細菌や真菌のセルロース分解酵素のオルソログを保有している。この網…

2025-11-05

RNA:DNA三重鎖の予測と解析のためのインタラクティブなプラットフォーム 3plex Web

Preprint 2025 human genome mouse RNA:DNA triplex lncRNA

Long non-coding RNAs（lncRNA）は、タンパク質やDNAを含む他の分子と協調することでその機能を発揮する。一本鎖RNA（ssRNA）と二本鎖DNA（dsDNA）の相互作用によって形成される三重鎖構造（トリプレックス）は、lncRNAが生体内で特定のゲノム配列を標的とす…

2025-11-04

生態系特異性･機能的遺伝子の探索ができるMAGゲノムのグローバルリポジトリ gcMeta

2019 2025 web tool KEGG Virulence Factor 抗生物質耐性遺伝子 (ARGs) COG PLM metagenome ヒト腸内 (human gut) secondary metabolites gene cluster

2025/11/05 誤字修正メタゲノムシーケンシングの急速な発展により、メタゲノムアセンブルゲノム（MAG）の前例のない膨大なデータが生成され、微生物の発見および機能的特徴づけの機会が一変した。しかしながら、これらの資源を完全に活用することは、データ…

2025-10-30

マイクロバイオーム群集検出のためのウェブツール MiCoDe

2025 Bioinformatics microbial diversity microbial populations

Microbiome Community Detector (MiCoDe) は、ベイジアン加重確率的ブロックモデルを用いて微生物分類群のネットワークをコミュニティにクラスタリングする、無料の使いやすいウェブツールである。MiCoDeはデータを自動的にフィルタリングし、高次元性、構成…

2025-10-23

SingleMによってプロファイリングした公開メタゲノムデータの地理的・生態学的情報を提供する Sandpiper

2025 Nature Biotechnology web tool GTDB metagenome

メタゲノムデータにおける微生物の分類群と相対的豊度の決定は、技術的に依然として困難である。本研究では、普遍的マーカー遺伝子内の保存領域を用いて群集構成を推定する「SingleM」を提案する。ゲノム情報が欠如した種を正確に組み込むことで、未知種がほ…

2025-10-23

MSRスケッチングに基づくHiFiリードの高速かつハプロタイプ認識型(aware)のアセンブリを行う Alice

2025 Preprint metagenome assembly Pacbio 高速なツール haplotype

マッピングに適したシーケンス削減（MSR）スケッチを提案する。これは高忠実度（HiFi）ロングリード向けのスケッチ手法であり、これらのスケッチを直接操作するアセンブラ「Alice」を提供する。MSRはコンパクトな表現を生成し、(i) アライン可能な配列（2つ…

2025-10-23

組成とカバレッジの分離によるグラフベースのメタゲノムビニングを行う CoCoBin

2025 Preprint Binning (metagenomics) テスト失敗

メタゲノムビニングはメタゲノム解析における重要なステップであり、同一ゲノム由来のコンティグを一貫性のあるグループにクラスタリングすることを目的とする。現代的なワークフローでは、ほとんどのビニングツールはショットガンメタゲノムシーケンスデー…

2025-10-21

ヒトNGSデータにおけるコンタミネーションと血縁関係の検出、定量ツール NGSTroubleFinder

2025 Preprint human genome contamination 法医学系統解析 Kinship Analysis

品質管理はNGSパイプラインの基本的なステップであるが、軽視されがちである。クロスサンプルコンタミネーションやサンプルスワップのような問題を検出することは、データの完全性を管理するために不可欠である。ここでは、ヒトの全ゲノムおよび全トランスク…

2025-10-17

ペタバイト規模の公共配列リポジトリへの効率的かつ正確な検索を行う MetaGraph

2025 Nature metagenome SRA 高速なツール database web tool Marine Metagenomics

公開リポジトリで利用可能な生物学的シーケンスデータの量は急速に増加しており、生物医学にとって重要な資源を形成している。しかし、これらのデータを効率的かつ正確に全文検索可能にすることは依然として課題である。本研究では、大規模なシーケンスセッ…

2025-10-14

ゲノム間のアラインメントを高速に行う FastGA

Bioinformatics Advances 2025 PAF format 高速なツール genome alignment k-mer

FastGAは、同等の感度を持つ従来手法と比較して1桁以上高速に2つのゲノム配列間のアラインメントを発見する。その高速性は以下の要因による：(a) MSD基数ソートとマージのみを伴う完全キャッシュローカルアーキテクチャ、(b) ソート済みk-merテーブルの線形…

2025-10-09

Helixerと比較して新規アノテーションのミスを探す AnnotationSplitter

2025 BMC Genomics annotation eukaryotic genome annotation chimera transcript fusion gene annotation error

非モデル生物におけるゲノム解析では、タンパク質コード遺伝子の正確なアノテーションが極めて重要である。しかし、限られたRNA-Seqデータと不完全なタンパク質リソースは、誤ったアノテーションを引き起こす可能性がある。例えば、隣接する2つ以上の遺伝子…

2025-10-01

深層学習を用いて細菌分離株の高精度なSNVコールを行う AccuSNV

2025 dN/dS Preprint bacteria snakemake

細菌種内の変異を正確に検出することは、微生物進化の基礎研究、伝播事象の再構築、抗菌薬耐性変異の同定において極めて重要である。全ゲノムシーケンスから一塩基多型（SNV）を特定する多くのツールが開発されているが、細菌ゲノムの複雑さや、サンプルタイ…

2025-09-30

ロングリードベースの真核生物アセンブリを７つの指標で評価する PAQman

2025 docker Preprint evaluation tool telomere T2T assembly Singularity

ロングリードシーケンシングとアセンブリアルゴリズムの進歩により、高品質なゲノムアセンブリの生成はより容易かつ費用対効果の高いものとなった。しかし、既存ツールはしばしば限られた指標に依存し、あるいは比較用のリファレンスアセンブリを必要とする…

2025-09-22

McDevol

2025 Preprint Binning (metagenomics) benchmark テスト失敗

メタゲノム・ビニングのための最近の深層学習手法のいくつかは、高品質なメタゲノムアセンブリゲノムの回収率向上を主張している。これらの手法は、contig embeddings（コンティグの主要な特徴量を固定次元のベクトルに変換する操作を行ったもの）を学習しク…

2025-09-12

包括的な高品質MAGのデータベース MAGdb

2025 Genome Biology database metagenome MAG MIMAGs/MISAGs

微生物群集のメタゲノム解析は、メタゲノムアセンブリゲノム（MAG）の再構築により、種間および種内の遺伝的多様性が非常に高いレベルで存在することを明らかにした。MAGデータベース（MAGdb）は、臨床、環境、動物のカテゴリーにまたがる74の代表的な研究論…

2025-09-11

fastpのバッチ処理スクリプトを使う

2025 iMeta fasta/fastqの操作 tips 高速なツール

2025/09/19 追記 fastpのversion 1.0がリリースされ、フォルダ内のfastqをバッチ処理する便利なスクリプトも提供されました。このスクリプトの使い方を確認しておきます。インストール最新のfastpにパスが通っている必要がある。fastpのバージョンが１未満…

2025-09-11

ピークコール結果から遺伝子へのマッピングを行う peakScout

2025 Preprint ChIP-Seq web tool ATAC-seq UCSC

peakScoutは、ゲノムピークデータと遺伝子アノテーションの間のギャップを迅速かつ容易に埋めるために設計されたコマンドラインおよびウェブベースのバイオインフォマティクスツールであり、研究者が調節エレメントの測定値とその標的遺伝子との関係を理解す…

2025-09-10

ゲノムアセンブリからウイルスゲノムを発見して正確なアノテーションをつける Cenote-Taker 3

2025 Preprint virome virus annotation metagenome

ウイルスは地球上のあらゆる環境に豊富に存在し、あらゆる細胞生物を感染させる。にもかかわらず、ウイルスはゲノム科学者にとって一種のブラックボックスである。その遺伝的多様性は他の全ての生命体を合わせたものよりも大きく、そのゲノムはシーケンシン…

2025-09-10

超高速なGFF操作ユーティティ GFFx

2025 GFF 高速なツール Preprint

ゲノムアノテーションは、多様な調節要素や転写バリアントの発見により、ますます包括的になりつつある。しかし、このアノテーション精度の向上は、特に大規模ゲノムやパンゲノムを横断する効率的なクエリに対して重大な課題をもたらす。既存のツールは、大…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2025

ゲノムアノテーションとゲノム多様性解析のためのオールインワンワークフロー EASYstrata

細菌ゲノムの新規アノテーションのための統合プラットフォーム BacExplorer

完全に自動化された 16S･18Sメタアンプリコン解析パイプライン AmpWrap

軽量かつインタラクティブなアライメントの視覚化を行う Alignoth

大規模データにおいて形質の進化的関連性を調べる SimPhyNI

マルチスケール適応型クラスタリングと評価によるメタゲノムロングリードの効率的なビニングを行う LorBin

シンテニープロット解析前のクオリティコントロールを行う SyntenyQC

８つの生物種におけるオルソログ起源情報を提供する OrthoGuide

ゲノム近傍を解析するwebサービス GNAT

細胞外多糖類生合成遺伝子クラスターを発見する epsSMASH

ロングリードの事前フェーシングでSVジェノタイピングを改善する SVUPP

シード遺伝子からオルソログを高速探索できる fDOG

RNA:DNA三重鎖の予測と解析のためのインタラクティブなプラットフォーム 3plex Web

生態系特異性･機能的遺伝子の探索ができるMAGゲノムのグローバルリポジトリ gcMeta

マイクロバイオーム群集検出のためのウェブツール MiCoDe

SingleMによってプロファイリングした公開メタゲノムデータの地理的・生態学的情報を提供する Sandpiper

MSRスケッチングに基づくHiFiリードの高速かつハプロタイプ認識型(aware)のアセンブリを行う Alice

組成とカバレッジの分離によるグラフベースのメタゲノムビニングを行う CoCoBin

ヒトNGSデータにおけるコンタミネーションと血縁関係の検出、定量ツール NGSTroubleFinder

ペタバイト規模の公共配列リポジトリへの効率的かつ正確な検索を行う MetaGraph

ゲノム間のアラインメントを高速に行う FastGA

Helixerと比較して新規アノテーションのミスを探す AnnotationSplitter

深層学習を用いて細菌分離株の高精度なSNVコールを行う AccuSNV

ロングリードベースの真核生物アセンブリを７つの指標で評価する PAQman

McDevol

包括的な高品質MAGのデータベース MAGdb

fastpのバッチ処理スクリプトを使う

ピークコール結果から遺伝子へのマッピングを行う peakScout

ゲノムアセンブリからウイルスゲノムを発見して正確なアノテーションをつける Cenote-Taker 3

超高速なGFF操作ユーティティ GFFx