ランダムフォレスト分類器により全遺伝子の存在パターンを予測する PanForest

2026 Bioinformatics pan-genome

ゲノム中の一部の遺伝子の有無は、他の遺伝子の存在の可能性に影響を与える可能性がある。こうした遺伝子の共起と回避のパターンを理解することで、ゲノム構成の基本原理が明らかになり、進化的再構成から合成ゲノムの合理的設計に至るまで、幅広い応用が期…

2026-01-14

軽量かつインタラクティブなアライメントの視覚化を行う Alignoth

2025 Bioinformatics bam/sam 結果の視覚化 (visualization)

Alignothは、DNAシーケンシングリードアライメントパイルアップの自己完結型でポータブルなHTMLレポートを生成する軽量コマンドラインアプリケーションである。PNG、SVG、PDFなどの静的フォーマットやJSONベースの埋め込み可能な形式へのエクスポートもサポ…

2026-01-04

シンテニープロット解析前のクオリティコントロールを行う SyntenyQC

2025 Bioinformatics synteny_block

SyntenyQCは、シンテニープロットを構築するためのデータ前処理ツールである。ゲノムデータの収集、アノテーション、デレプリケーションをサポートし、有益なシンテニープロットの構築を容易に（場合によっては根本的に）実現する。 SyntenyQCは、Pythonバー…

2025-12-04

ロングリードの事前フェーシングでSVジェノタイピングを改善する SVUPP

2025 Bioinformatics

ここでは、リードのフェージング情報を遺伝子型尤度に組み込むことでSVの遺伝子型判定を改善する手法SVUPPを提案する。包括的なベンチマーク評価により、SVUPPは近傍にSVが存在しない場合のSV遺伝子型判定において、オックスフォード・ナノポア・テクノロジ…

2025-10-31

SVアノテーションのための統合webツール AnnotSV 2023アップデート

2023 human whole genome human de novo mutation web tool 2018 Nucleic Acids Research Bioinformatics structural variations (SV) database 2021 variant ranking clinical and diagnostic

ヒト遺伝子のバリアントレパートリーの多くは、一塩基多型（SNV）とsmall indelで構成されているが、構造多型（SV）は依然として私たちの変異DNAの主要な部分を占めている。SVの検出は、各カテゴリーのSVを検出するために異なる技術（アレイCGH、SNPアレイ、…

2025-10-31

メタゲノム腸内微生物叢プロファイリングによる健康評価のためのwebアプリケーション GMWI-webtool

2023 Bioinformatics Nature Communications clinical and diagnostic web tool metagenome ヒト腸内 (human gut)

本著者らは最近、腸内微生物叢の状態から疾患発生の可能性を判定し健康状態を評価する指標として、糞便メタゲノムに基づく「腸内微生物叢ウェルネス指数（GMWI）」を導入した。このウェルネス指数の算出は、健康に有益な種と健康に有害な種の相対的豊かさに…

2025-10-30

マイクロバイオーム群集検出のためのウェブツール MiCoDe

2025 Bioinformatics microbial diversity microbial populations

Microbiome Community Detector (MiCoDe) は、ベイジアン加重確率的ブロックモデルを用いて微生物分類群のネットワークをコミュニティにクラスタリングする、無料の使いやすいウェブツールである。MiCoDeはデータを自動的にフィルタリングし、高次元性、構成…

2025-08-22

メタゲノムデータから株レベルの多様性を検出する metaSNV

2021 Bioinformatics metagenome SNV genetic distance sub-populations bacteria

微生物群集の分類学的解析は、種および株レベルで十分に支持されている。しかし、種内には顕著な表現型の多様性が存在し、株は世界的な集団間で広く共有されることは稀である。種と株の間の多様性を層別化することで、「>亜種」と呼ばれる有用な中間層を特定…

2025-08-17

重複遺伝子のコピー数をマッピングデータから推定する parascopy

2022 Nature Communications 2023 Bioinformatics human genome human whole genome Copy Number Variation (CNV)

ヒトゲノムには数百の低コピー反復配列（LCR）が存在するが、コピー数のばらつきが大きく、リードマッピングがあいまいなため、ショートリードシーケンス技術による解析は困難である。LCRに重複する150以上の重複遺伝子のコピー数および配列の変異は、単発性…

2025-08-12

親から子へゲノムのどの部分が受け継がれたかを描画する Pedigree Painter (pepa)

2025 Bioinformatics Pedigree family web tool SNP 結果の視覚化 (visualization) recombination

ゲノミクス分野においてデータ可視化はますます重要性を増しており、研究者が世代を超えて遺伝と組み換えのパターンを解明するのを可能にしている。既存のツールの多くは祖先予測に焦点を当てているが、親の遺伝子が子孫のゲノムにどのように寄与するかを分…

2025-08-12

メタゲノムの菌叢存在量を株レベルで正確に定量する StrainR2

Bioinformatics 2025 docker strain-level profiling metagenome abundance estimation in metagenomics data

合成微生物群集は、管理可能なモデルシステムにおいて還元主義的研究を行う機会を提供する。しかし、これらの群集内における高度に類似した株のアバンダンスを推定することは、現在信頼性が低い状態になっている。16S rRNA遺伝子シーケンシングは株レベルで…

2025-08-06

細菌のSNPおよびSVの検出に適したオールインワンのパイプライン VariantDetective

2024 Bioinformatics SNV SNP structural variations (SV)

ゲノム変異は、１塩基ヌクレオチド多型（SNP）から大規模な構造変異（SV）まで、多様な変化のスペクトラムを構成し、細菌の進化と種分化に重要な役割を果たしている。SNPsとSVsを正確に同定することは、その後の進化研究や疫学研究に有益である。本研究では…

2025-05-31

細菌ゲノムのロングリードコンセンサスアセンブリを行う Autocycler

2025 Preprint bacteria assembly dot plot GFA error correction misassembly mix-assembly Bioinformatics

2025/09/03論文追記ロングリードシーケンスにより完全な細菌ゲノムアセンブリが可能になるが、個々のアセンブラは不完全であり、しばしば配列レベルや構造エラーが生じる。Trycyclerを用いたコンセンサスアセンブリは精度を向上させることができるが、自動…

2025-05-04

オルソロジーに基づく代替モデル生物の選択を支援する OMAMO

Bioinformatics 2022 orthologue web tool

生物種を超えてパスウェイや遺伝子が保存されていることから、科学者はヒト以外のモデル生物を用いてヒトの生物学をより深く理解することができるようになった。しかし、マウス、ラット、ゼブラフィッシュのような伝統的なモデル系を使用することは、コスト…

2025-05-04

パンゲングラフによって遺伝子含有量を探索する pangene

pan-genome human genome Bioinformatics 2024 Copy Number Variation (CNV)

遺伝子内容は生物の生物学的性質を制御しており、種間および同一種内の個体間で変化する。細菌ゲノムにおける遺伝子内容の変化を特定するツールは開発されているが、ヒトパンゲノムのような大規模な真核生物ゲノムのコレクションには適用可能なものは存在し…

2025-05-03

ゲノム配列から高精度なab initioの遺伝子構造予測を行う Tiberius

2024 Bioinformatics 高速なツール eukaryotic genome annotation ab initio gene prediction Singularity

25年以上にわたり、学習ベースの真核生物遺伝子予測は、DNA配列を直接入力する隠れマルコフモデル（HMM）によって駆動されてきた。最近、HolstらはHelixerを用いて、深層学習とHMMポストプロセッサーを組み合わせることでab initio真核生物遺伝子予測の精度…

2025-04-11

ロングリードのマッピングから構造バリアントとジェノタイピングを行う Sawfish

2025 Bioinformatics structural variations (SV) Pacbio joint calling human whole genome テスト失敗

構造バリアント（SV）は進化および機能ゲノミクスにおいて重要な役割を果たすが、その特性解析は困難である。高精度のロングリードシーケンスは、効果的なコーリング手法と組み合わせることで、SVの特性解析を大幅に改善することができる。最新のロングリー…

2025-03-29

全ゲノムアラインメントを操作するための超高速ツールキット Wgatools

docker Singularity PAF format multi-fasta alignment (MAF) format conversion chain format dot plot 結果の視覚化 (visualization) 2025 Bioinformatics SNV small indel structural variations (SV)

ロングリードシーケンス技術の急速な発展により、個体完全長ゲノムの時代が近づいている。本著者らは、様々な全ゲノムアラインメント（WGA）フォーマットをサポートし、アラインメントの変換、処理、評価、可視化のための実用的なツールを提供する、クロスプ…

2025-02-24

原核生物アセンブリのための包括的でスケーラブルなNextflowアノテーションパイプライン mettannotator

2025 Bioinformatics bacterial annotation nextflow pseudogene tRNA rRNA CAZymes CRISPR KEGG AMR gene cluster protein domain circos

近年、原核生物のゲノムアセンブリが急増しており、単離された生物や環境サンプルの両方から得られている。これらのアセンブリには、リファレンスデータベースでは十分に表現されていない新規の生物種が含まれることが多く、よく記述されている分類群と新規…

2024-11-04

メタゲノム配列プロファイリングのためのMinimizerベースのナイーブベイズ分類器 MNBC

2024 Bioinformatics metagenome 生物種の推定 (taxonomic profiling)

メタゲノムシーケンスリードを分類するための最先端のツールは、迅速かつ正確な選択肢を提供するが、単一のツールで両者を組み合わせることは、常に改善される研究分野である。機械学習ベースのNaïve Bayes Classifier (NBC)アプローチは、サンプル内のすべ…

2024-10-27

ゲノムアセンブリのエクストラロングタンデムリピート（ETR）を評価する TandemTools

tandem repeats centromere large genome 2020 Bioinformatics

Extra-longタンデムリピート（ETR）は真核生物のゲノムに広く存在し、染色体分離などの基本的な細胞内プロセスに重要な役割を果たしている。新しいロングリード技術によってETRのアセンブリが可能になったが、その品質を評価するツールがないため、アセンブ…

2024-09-18

タンパク質配列のゲノム配列へのスプライスアライメントの速度と精度を向上させた Spaln3

2024 protein-to-genome alignment Bioinformatics

Spalnは、哺乳類サイズの真核生物ゲノム配列にタンパク質のクエリ配列をスプライスアライメントし、自己完結的にゲノムマッピングを行うための最も初期の実用的なツールである。しかし、その計算速度は、急速に増加するゲノムおよび転写産物配列データの解析…

2024-08-30

出版品質の一塩基多型可視化プロットを出力する Snipit

Bioinformatics 2024 SARS-CoV-2 Viruses haplotype 結果の視覚化 (visualization)

Snipitは、配列中の一塩基多型を参照配列と比較して要約するためにデザインされた解析・可視化ツールである。このツールは、ヌクレオチドやアミノ酸の違いを効率的にカタログ化し、カスタマイズ可能な出版用の図を通して明確な比較を可能にする。設定可能な…

2024-06-25

タンパク質構造検索・アライメントアルゴリズム Reseek

2024 Preprint protein search all versus all sequence comarison PDB 高速なツール multiple structural alignment (MSTA) Bioinformatics

2026/02/04 追記アミノ酸配列からのタンパク質フォールド予測における最近のブレークスルーは、新しい構造の洪水を解き放った。タンパク質空間への洞察を広げ、生物工学や治療法への実用化を追求する新たな機会をもたらすと同時に、新たな課題も提示してい…

2024-06-20

ゲノム領域を柔軟に調整して視覚化と比較ができるユーザーフレンドリーなアプリケーション GenoFig

2024 Bioinformatics GUIツール結果の視覚化 (visualization)

生物の分子進化の歴史を理解するには、通常、近縁種や系統のゲノム領域を視覚的に比較する必要がある。このタスクを達成するためのアプリケーションはすでにいくつか存在するが、それらは古すぎたり、限定的すぎたり、あるいは複雑すぎたりして、ほとんどの…

2024-06-13

タンパク質言語モデルの配列表現の直接比較に基づいて遠隔相同性検出を行う pLM-BLAST

BLAST 2023 PLM Bioinformatics web tool

配列比較による相同性の検出は、タンパク質の機能と進化の研究における典型的な最初のステップである。この研究では、タンパク質言語モデルのこのタスクへの適用可能性を探る。pLM-BLASTはBLASTにインスパイアされたツールであり、タンパク質言語モデルProtT…

2024-06-11

T2Tゲノムアセンブリの評価ツール Genome Continuity Inspector (GCI)

Trio binning assembly 2024 Preprint Nanopore long read Pacbio evaluation tool T2T assembly Bioinformatics

最近のロングリードシーケンス技術の進歩により、高品質なゲノムアセンブリの作成が大幅に容易になった。テロメアtoテロメアなギャップレス（T2T）アセンブリは、ゲノムアセンブリの新たなゴールデンスタンダードとなっている。最近、T2Tレベルのリファレン…

2024-05-15

ウェブブラウザ上で高品質な高分子構造の可視化を行う Protein Imager

2020 Bioinformatics structure viewer membrane protein 結果の視覚化 (visualization) Figure (scientific illustration)

分子ビューアーの長い学習曲線は、研究者が初めて構造生物学の分野にアプローチする際の妨げとなっている。ここでは、次世代のオンライン分子ビューアーとして、軽量で強力かつ使いやすいインターフェースである'The Protein Imager'を紹介する。さらに、こ…

2024-05-03

高速かつ様々なプロファイルに対応可能な、次世代シークエンシングデータの次世代のシミュレーター NGSNGS

2023 高速なツール Ancient DNA simulator Bioinformatics Mate Pair

シークエンシングの世代が変わるにつれてDNAシークエンサーの性能が急速に向上し、生成されるデータ量も増加した。この進化は、新しいバイオインフォマティクスの手法にもつながっており、モデルの精度やゲノム解析パイプラインの頑健性を検証する際に、in s…

2024-04-25

細菌の保存されたタンパク質の割合を計算するためのNextflowパイプライン POCP-nf

2024 Bioinformatics nextflow POCP

2024/05/08 追記シーケンス技術の進歩により、細菌ゲノムは飛躍的に増加しており、確実な分類法が必要とされている。Qin et al. (2014)によって最初に提案されたPercentage Of Conserved Proteins (POCP)は、原核生物の属境界を評価するための貴重な指標で…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Bioinformatics