細菌ゲノムの新規アノテーションのための統合プラットフォーム BacExplorer

ハイスループットシーケンシング（HTS）は、微生物学者の日常的な分析に不可欠な要素となっている。数十のサンプルをシーケンシングするプロセスでは、手作業ではアノテーションを付与できない膨大な量のデータが生成される。この課題に対処するため、長年に…

2025-11-08

BioTextQuest v2.0

2024 Computational and Structural Biotechnology Journal web tool テスト失敗

生物医学文献の広大な領域を探索し、検索を実行したり、それらをバイオインフォマティクス解析と組み合わせたりする過程は、科学文献の指数関数的な増大と、PubMedおよび関連リポジトリを対象とした多数のマイニングツールの存在を考慮すると、困難である。…

2025-10-23

組成とカバレッジの分離によるグラフベースのメタゲノムビニングを行う CoCoBin

2025 Preprint Binning (metagenomics) テスト失敗

メタゲノムビニングはメタゲノム解析における重要なステップであり、同一ゲノム由来のコンティグを一貫性のあるグループにクラスタリングすることを目的とする。現代的なワークフローでは、ほとんどのビニングツールはショットガンメタゲノムシーケンスデー…

2025-09-22

McDevol

2025 Preprint Binning (metagenomics) benchmark テスト失敗

メタゲノム・ビニングのための最近の深層学習手法のいくつかは、高品質なメタゲノムアセンブリゲノムの回収率向上を主張している。これらの手法は、contig embeddings（コンティグの主要な特徴量を固定次元のベクトルに変換する操作を行ったもの）を学習しク…

2025-08-17

ロングリードメタゲノムの解析と評価のためのsnakemakeパイプライン (MAEPLR)

2025 Preprint Binning (metagenomics) Pacbio metagenome 結果の視覚化 (visualization) evaluation tool テスト失敗

(Prepirntより) メタゲノムアセンブリは、微生物生態系のシーケンシングデータから高品質なゲノムをできるだけ多く再構築することを目的としている。Hi-Fiロングリードなどのアセンブリを容易にする技術的進歩があるにもかかわらず、数百から数千の集団が混…

2025-08-17

pplacerDC

2021 系統解析テスト失敗

系統樹への配列の配置（すなわち、配列を系統樹に挿入する作業）は、メタゲノム解析における分類群の同定や大規模な系統推定など、複数のバイオインフォマティクスパイプラインにおける基本的なステップである。現在最も正確な方法はpplacerで、maximum like…

2025-08-14

構造ガイド付きアノテーションパイプライン EcoFoldDB-annotate

2025 Preprint structural aligners protein language model (PLM) GPU テスト失敗

微生物群集は、地球の健康と生態系プロセスに不可欠な役割を果たしている。高スループットメタゲノムシーケンス技術は、これらの群集の構造と機能に関する前例のない洞察を提供してきた。しかし、既存の配列相同性に基づく手法の感度限界により、メタゲノム…

2025-04-11

ロングリードのマッピングから構造バリアントとジェノタイピングを行う Sawfish

2025 Bioinformatics structural variations (SV) Pacbio joint calling human whole genome テスト失敗

構造バリアント（SV）は進化および機能ゲノミクスにおいて重要な役割を果たすが、その特性解析は困難である。高精度のロングリードシーケンスは、効果的なコーリング手法と組み合わせることで、SVの特性解析を大幅に改善することができる。最新のロングリー…

2025-01-20

メタゲノムデータのLCA推定と分類学的プロファイリングを行う ngsLCA

2022 LCA metagenome Methods in Ecology and Evolution テスト失敗

環境サンプルから生成されたメタゲノム・データは、現代および古代の生物群集の解析においてますます一般的になってきている。この種のデータから分類学的プロフィールを得るためには、DNA配列を大規模なゲノム参照データベースに対してアラインメントし、各…

2024-10-27

ロングリードを完全長ゲノムアセンブリの難しい領域へ正確にマッピングする VerityMap

2022 Genome Research mapping Pacbio Nanopore long read テスト失敗

最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間（完全）アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、…

2024-06-01

メタゲノムアセンブリゲノムの品質を評価するパイプライン MAGqual

MIMAGs/MISAGs 2023 Preprint metagenome Binning (metagenomics) quality check テスト失敗

微生物群集の全ゲノム配列を決定するメタゲノミクスは、複雑な生態系に対する洞察を提供してきた。新規微生物の発見を容易にし、群集の相互作用を説明し、様々な分野で応用されている。ハイスループットと第3世代シーケンシング技術の進歩は、その普及にさら…

2024-03-23

ヒトmycobiomeプロファイリングのために真菌の分類学的および機能的データベースを組み込んだパイプライン FunOMIC

2022 Computational and Structural Biotechnology Journal fungi 生物種の推定 (taxonomic profiling) テスト失敗

細菌マイクロバイオームの解析は日常的に行われるようになったが、真菌マイクロバイオームの解析は、頑健なデータベースとバイオインフォマティック・パイプラインの欠如によって、いまだに妨げられている。ここでは、真菌を同定するための分類学的データベ…

2024-03-14

メタゲノムシークエンシングデータから微生物真核生物ゲノムを取り出すパイプライン Eukfinder

2023 Preprint Nanopore long read Pacbio テスト失敗

微生物群集のホールゲノムショットガン（WGS）メタゲノムシークエンシングにより、多様な生態系に生息する微生物の原核生物や真核生物の機能、生理、進化の歴史を発見することができる。その重要性にもかかわらず、微生物真核生物のメタゲノム研究は、WGSデ…

2024-02-20

メタゲノムのリードの発生からbinningまで自動でシミュレーションする MAGICIAN

2024 BMC Genomics simulator metagenome Binning (metagenomics) automated pipeline テスト失敗

シーケンスリードからメタゲノムアセンブリゲノム（MAGs）を回収することで、微生物群集とその構成員に関するさらなる洞察が可能になり、場合によっては単一分離ゲノム用に設計されたツールでそのような配列を解析することもできる。結果の質は配列の質に依…

2024-01-15

ウルトラロングデータセットに対する高速多重塩基配列アラインメント法 FMAlign2

2024 Bioinformatics multiple sequence alignment (MSA) 高速なツールテスト失敗

バイオインフォマティクスにおいて、マルチプル配列アライメント（MSA）は極めて重要なタスクである。しかし、従来の方法では、ウルトラロングシークエンスのアライメントに苦労することが多い。この問題に対処するため、研究者たちは、並列アラインメントの…

2024-01-04

分類学的シグナルを組み込むことでメタゲノムリードのアノテーションと分類学的プロファイリングを改善する RAT

2023 Preprint metagenome テスト失敗

メタゲノム解析には、リードベースの分類学的プロファイリング、アセンブル、メタゲノムアセンブリゲノム（MAGs）のビニングが一般的である。ここでは、これらのステップを統合したRead Annotation Tool (RAT)を報告する。RATを使ってMAGやコンティグから得…

2023-07-21

遺伝子アノテーションの品質評価を行う OMArk

Preprint 2022 eukaryotic genome annotation evaluation tool web tool テスト失敗 2024 Nature Biotechnology

多様な生物種のゲノム配列がますます豊富になる時代において、タンパク質をコードする遺伝子レパートリーの質を評価することは極めて重要である。最先端のゲノムアノテーション評価ツールは、遺伝子レパートリーの完全性を測定するが、遺伝子の過剰予測やコ…

2023-04-12

De novoトランスクリプトームアセンブリとアノテーションのSnakemakeパイプライン transXpress

2023 BMC Bioinformatics de novo transcriptome snakemake 高速なツールテスト失敗

RNA-seqとde novoトランスクリプトームアセンブリは、非モデル生物の生物学的研究に変革をもたらす技術であるが、RNA-seqデータの計算処理には、多くの異なるソフトウェアツールが必要である。このようなde novoトランスクリプトームワークフローの複雑さは…

2023-04-06

断片的なアセンブリから高品質のバクテリオファージゲノムを得る Phables

2023 Preprint phage assembly graph テスト失敗

ヒトの腸内に存在する微生物群は、ヒトの健康に強い影響を及ぼしている。腸内細菌やウイルスは、炎症性腸疾患などの消化器系疾患に影響を与える。バクテリオファージと呼ばれる細菌に感染するウイルスは、ヒトの腸内の細菌群集を制御する上で重要な役割を担…

2023-03-28

染色体外環状DNA（eccDNA）を検出するパイプライン ECCsplorer

2022 BMC Bioinformatics eccDNA テスト失敗

Extrachromosomal circular DNAs（eccDNA）は、染色体から物理的に分離したリング状のDNA構造で、100bpから数メガバイトの大きさである。eccDNAは、タンデムに繰り返されるDNAの他に、遺伝子のコピーや最近活性化したトランスポゾームエレメントを持つことが…

2023-03-07

ヒトゲノム領域の包括的エンリッチメント解析ソフトウェア GREAP

2022 Briefings in Bioinformatics human genome Enhancer chip-seq テスト失敗

ゲノムのハイスループットシーケンスの急速な発展により、豊富なエピジェネティクスマーカーを持つDNA制御要素が多数同定され、機能性ゲノム領域データの急速な蓄積が促進されている。ヒトの機能性ゲノム領域の網羅的な理解と研究は、現在でも比較的急務の課…

2023-02-14

ノイズの多いロングリードの高感度で高速なマッピングを行う kngMap

2022 Frontiers in Genetics Nanopore long read Pacbio テスト失敗

PacBioやOxford Nanoporeのような1分子シーケンスの急速な発展に伴い、出力されるリードの長さは増加し続けており、最先端のゲノムアプリケーションに劇的な可能性を与えている。これらのリードをリファレンスゲノムにマッピングすることは、ダウンストリー…

2023-02-13

ScrapPaper

2022 Preprint 文献検索テスト失敗

本論文では、PubMedやGoogle Scholarの検索結果から雑誌情報を抽出するPythonスクリプト、ScrapPaperを紹介する。現在、このプログラムを開発した動機は、科学文献のタイトルやリンクなどの情報を取得し、リストとして保存してメタ分析や文献の比較研究など…

2022-11-25

メタゲノム情報も利用するメタトランスクリプトームアセンブラ MetaGT

2022 Frontiers in Microbiology metatranscriptome テスト失敗

メタゲノムシーケンスは、微生物コミュニティのゲノム配列と構成に関する洞察を提供することができるが、メタトランスクリプトーム解析は、微生物コミュニティの機能的活性を研究するために有用であると考えられる。RNA-Seqデータは、コミュニティ内の活性な…

2022-08-31

keggcharter

2022 Computational and Structural Biotechnology Journal KEGG ID mapping テスト失敗

Githubより KEGGCharter は KEGG API と Pathway 機能のユーザーフレンドリーな実装です。特徴は KEGG ID から KEGG Orthologs (KO) への変換、および KO から EC 番号への変換。主要な分類群の代謝ポテンシャルを KEGG メタボリックマップで表現（上位 10 …

2022-07-15

ノイズの多いロングリードを分類する deSAMBA

Frontiers in Cell and Developmental Biology 2021 Nanopore long read Pacbio clinical and diagnostic Viruses テスト失敗

ノイズの多いロングリードの分類を特定するための高速かつ正確な分類ツールが未だ存在せず、有望なロングリードメタゲノムシーケンス技術の利用におけるボトルネックとなっている。本発表では、de Bruijn graph-based Sparse Approximate Match Block Analyz…