macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2025-10-01から1ヶ月間の記事一覧

SingleMによってプロファイリングした公開メタゲノムデータの地理的・生態学的情報を提供する Sandpiper

メタゲノムデータにおける微生物の分類群と相対的豊度の決定は、技術的に依然として困難である。本研究では、普遍的マーカー遺伝子内の保存領域を用いて群集構成を推定する「SingleM」を提案する。ゲノム情報が欠如した種を正確に組み込むことで、未知種がほ…

MSRスケッチングに基づくHiFiリードの高速かつハプロタイプ認識型(aware)のアセンブリを行う Alice

マッピングに適したシーケンス削減(MSR)スケッチを提案する。これは高忠実度(HiFi)ロングリード向けのスケッチ手法であり、これらのスケッチを直接操作するアセンブラ「Alice」を提供する。MSRはコンパクトな表現を生成し、(i) アライン可能な配列(2つ…

MAGから汚染配列を除去するためのマルチモーダル深層言語モデル Deepurify

メタゲノムアセンブリゲノム(MAG)は、メタゲノムシーケンスデータを用いた微生物のダークマター探索に貴重な知見を提供する。しかし、MAG内の汚染が下流解析の結果に重大な影響を及ぼす可能性に対する懸念が高まっている。現在のMAG除染ツールは主にマーカ…

組成とカバレッジの分離によるグラフベースのメタゲノムビニングを行う CoCoBin

メタゲノムビニングはメタゲノム解析における重要なステップであり、同一ゲノム由来のコンティグを一貫性のあるグループにクラスタリングすることを目的とする。現代的なワークフローでは、ほとんどのビニングツールはショットガンメタゲノムシーケンスデー…

ヒトNGSデータにおけるコンタミネーションと血縁関係の検出、定量ツール NGSTroubleFinder

品質管理はNGSパイプラインの基本的なステップであるが、軽視されがちである。クロスサンプルコンタミネーションやサンプルスワップのような問題を検出することは、データの完全性を管理するために不可欠である。ここでは、ヒトの全ゲノムおよび全トランスク…

ペタバイト規模の公共配列リポジトリへの効率的かつ正確な検索を行う MetaGraph

公開リポジトリで利用可能な生物学的シーケンスデータの量は急速に増加しており、生物医学にとって重要な資源を形成している。しかし、これらのデータを効率的かつ正確に全文検索可能にすることは依然として課題である。本研究では、大規模なシーケンスセッ…

ゲノム間のアラインメントを高速に行う FastGA

FastGAは、同等の感度を持つ従来手法と比較して1桁以上高速に2つのゲノム配列間のアラインメントを発見する。その高速性は以下の要因による:(a) MSD基数ソートとマージのみを伴う完全キャッシュローカルアーキテクチャ、(b) ソート済みk-merテーブルの線形…

ロングリードからphased local assemblyにより2倍体ゲノムの構造変異とindelを正確に同定する VolcanoSV

構造変異(SV)はヒトゲノムの多様性に大きく寄与し、精密医療において重要な役割を果たす。一分子ロングリードシーケンシング技術の進歩はSV検出に画期的な資源を提供するものの、SVの切断点と配列を正確かつ堅牢に特定することは依然として困難である。本…

ロングリードデータから正確に構造変異を検出する SVsearcher

構造変異(SV)は、50bpを超えるサイズのゲノム再編成(欠失、挿入、反転など)を指す。これらは遺伝性疾患や進化メカニズムにおいて重要な役割を果たす。ロングリードシーケンシング技術(PacBioロングリードシーケンシングやOxford Nanopore(ONT)ロング…

Helixerと比較して新規アノテーションのミスを探す AnnotationSplitter

非モデル生物におけるゲノム解析では、タンパク質コード遺伝子の正確なアノテーションが極めて重要である。しかし、限られたRNA-Seqデータと不完全なタンパク質リソースは、誤ったアノテーションを引き起こす可能性がある。例えば、隣接する2つ以上の遺伝子…

メタゲノムコンティグのクラスタリング(binning)を行う MetaDecoder

メタゲノムコンティグを潜在的なゲノムにクラスタリングすることは、微生物集団の機能的役割を調査する上で重要なステップである。既存のアルゴリズムは、シミュレーションまたは実際のシーケンスデータセットでかなりの成功を収めている。しかし、複雑なメ…

メタボロミクスを含む大規模データをインタラクティブに扱う PathwayNexus

ハイスループットなオミクス手法により、メタボロミクスデータを含む大規模データセットが増加しており、解析が難しいことが少なくなくなってきている。複数のサンプリング条件(例:異なる時間や処理)におけるメタボロミクスデータをパスウェイの文脈でマ…

深層学習を用いて細菌分離株の高精度なSNVコールを行う AccuSNV

細菌種内の変異を正確に検出することは、微生物進化の基礎研究、伝播事象の再構築、抗菌薬耐性変異の同定において極めて重要である。全ゲノムシーケンスから一塩基多型(SNV)を特定する多くのツールが開発されているが、細菌ゲノムの複雑さや、サンプルタイ…