ここでは、リードのフェージング情報を遺伝子型尤度に組み込むことでSVの遺伝子型判定を改善する手法SVUPPを提案する。包括的なベンチマーク評価により、SVUPPは近傍にSVが存在しない場合のSV遺伝子型判定において、オックスフォード・ナノポア・テクノロジ…
植物材料の分解は地球規模の炭素循環の主要な推進力であり、従来は菌類や細菌に起因すると考えられてきた。しかし、一部の無脊椎動物も、水平遺伝子移動によって獲得された可能性のある、細菌や真菌のセルロース分解酵素のオルソログを保有している。この網…
生物医学文献の広大な領域を探索し、検索を実行したり、それらをバイオインフォマティクス解析と組み合わせたりする過程は、科学文献の指数関数的な増大と、PubMedおよび関連リポジトリを対象とした多数のマイニングツールの存在を考慮すると、困難である。…
異なる形式の配列座標やリファレンスゲノムを扱うことは、遺伝学研究において課題となる。この複雑性は、異なる命名規則を用いる多様なデータソースを変換・調和させる必要性から生じる。手動処理は時間がかかり専門知識を要するため、遺伝データセットの日…
家系図の作成は生物医学研究において繰り返し行われる作業だが、複雑なヒトの家系図を描画できるオンラインツールは少なく、無料のものはさらに限られている。DrawPedはこのギャップを埋めることを目的としている。DrawPedは標準的なPED形式の家系図ファイル…
ハイスループットシーケンスの時代においては、遺伝子バリアントの臨床評価には特別なソフトウェアが必要である。本著者らは、希少疾患遺伝学の分野の臨床医および研究者のために、使いやすいプラットフォームであるREEV(Review, Evaluate and Explain Vari…
Long non-coding RNAs(lncRNA)は、タンパク質やDNAを含む他の分子と協調することでその機能を発揮する。一本鎖RNA(ssRNA)と二本鎖DNA(dsDNA)の相互作用によって形成される三重鎖構造(トリプレックス)は、lncRNAが生体内で特定のゲノム配列を標的とす…
2025/11/05 誤字修正 メタゲノムシーケンシングの急速な発展により、メタゲノムアセンブルゲノム(MAG)の前例のない膨大なデータが生成され、微生物の発見および機能的特徴づけの機会が一変した。しかしながら、これらの資源を完全に活用することは、データ…
ヒト遺伝子のバリアントレパートリーの多くは、一塩基多型(SNV)とsmall indelで構成されているが、構造多型(SV)は依然として私たちの変異DNAの主要な部分を占めている。SVの検出は、各カテゴリーのSVを検出するために異なる技術(アレイCGH、SNPアレイ、…
本著者らは最近、腸内微生物叢の状態から疾患発生の可能性を判定し健康状態を評価する指標として、糞便メタゲノムに基づく「腸内微生物叢ウェルネス指数(GMWI)」を導入した。このウェルネス指数の算出は、健康に有益な種と健康に有害な種の相対的豊かさに…
ゲノム、トランスクリプトーム、プロテオームデータの解釈に不可欠なエンリッチメント解析は、メタボロミクス分野へも拡大している。さらに、メタ解析やマルチオミクス研究に見られるように、異なる研究やオミクスプラットフォームからのデータを統合する統…
Microbiome Community Detector (MiCoDe) は、ベイジアン加重確率的ブロックモデルを用いて微生物分類群のネットワークをコミュニティにクラスタリングする、無料の使いやすいウェブツールである。MiCoDeはデータを自動的にフィルタリングし、高次元性、構成…
変異プライマー(通常は16Sリボソーム遺伝子領域を標的とする)を用いて生成されたPCR増幅産物のシーケンシングは、複雑な微生物サンプルの分類学的構成をプロファイリングするためにメタゲノミクスで広く用いられている。プライマー選択における分類学的バ…
メタゲノムデータにおける微生物の分類群と相対的豊度の決定は、技術的に依然として困難である。本研究では、普遍的マーカー遺伝子内の保存領域を用いて群集構成を推定する「SingleM」を提案する。ゲノム情報が欠如した種を正確に組み込むことで、未知種がほ…
マッピングに適したシーケンス削減(MSR)スケッチを提案する。これは高忠実度(HiFi)ロングリード向けのスケッチ手法であり、これらのスケッチを直接操作するアセンブラ「Alice」を提供する。MSRはコンパクトな表現を生成し、(i) アライン可能な配列(2つ…
2025/11/05 追記 メタゲノムアセンブリゲノム(MAG)は、メタゲノムシーケンスデータを用いた微生物のダークマター探索に貴重な知見を提供する。しかし、MAG内の汚染が下流解析の結果に重大な影響を及ぼす可能性に対する懸念が高まっている。現在のMAG除染ツ…
メタゲノムビニングはメタゲノム解析における重要なステップであり、同一ゲノム由来のコンティグを一貫性のあるグループにクラスタリングすることを目的とする。現代的なワークフローでは、ほとんどのビニングツールはショットガンメタゲノムシーケンスデー…
品質管理はNGSパイプラインの基本的なステップであるが、軽視されがちである。クロスサンプルコンタミネーションやサンプルスワップのような問題を検出することは、データの完全性を管理するために不可欠である。ここでは、ヒトの全ゲノムおよび全トランスク…
公開リポジトリで利用可能な生物学的シーケンスデータの量は急速に増加しており、生物医学にとって重要な資源を形成している。しかし、これらのデータを効率的かつ正確に全文検索可能にすることは依然として課題である。本研究では、大規模なシーケンスセッ…
FastGAは、同等の感度を持つ従来手法と比較して1桁以上高速に2つのゲノム配列間のアラインメントを発見する。その高速性は以下の要因による:(a) MSD基数ソートとマージのみを伴う完全キャッシュローカルアーキテクチャ、(b) ソート済みk-merテーブルの線形…
構造変異(SV)はヒトゲノムの多様性に大きく寄与し、精密医療において重要な役割を果たす。一分子ロングリードシーケンシング技術の進歩はSV検出に画期的な資源を提供するものの、SVの切断点と配列を正確かつ堅牢に特定することは依然として困難である。本…
構造変異(SV)は、50bpを超えるサイズのゲノム再編成(欠失、挿入、反転など)を指す。これらは遺伝性疾患や進化メカニズムにおいて重要な役割を果たす。ロングリードシーケンシング技術(PacBioロングリードシーケンシングやOxford Nanopore(ONT)ロング…
非モデル生物におけるゲノム解析では、タンパク質コード遺伝子の正確なアノテーションが極めて重要である。しかし、限られたRNA-Seqデータと不完全なタンパク質リソースは、誤ったアノテーションを引き起こす可能性がある。例えば、隣接する2つ以上の遺伝子…
メタゲノムコンティグを潜在的なゲノムにクラスタリングすることは、微生物集団の機能的役割を調査する上で重要なステップである。既存のアルゴリズムは、シミュレーションまたは実際のシーケンスデータセットでかなりの成功を収めている。しかし、複雑なメ…
ハイスループットなオミクス手法により、メタボロミクスデータを含む大規模データセットが増加しており、解析が難しいことが少なくなくなってきている。複数のサンプリング条件(例:異なる時間や処理)におけるメタボロミクスデータをパスウェイの文脈でマ…
細菌種内の変異を正確に検出することは、微生物進化の基礎研究、伝播事象の再構築、抗菌薬耐性変異の同定において極めて重要である。全ゲノムシーケンスから一塩基多型(SNV)を特定する多くのツールが開発されているが、細菌ゲノムの複雑さや、サンプルタイ…
ロングリードシーケンシングとアセンブリアルゴリズムの進歩により、高品質なゲノムアセンブリの生成はより容易かつ費用対効果の高いものとなった。しかし、既存ツールはしばしば限られた指標に依存し、あるいは比較用のリファレンスアセンブリを必要とする…
細菌の遺伝子機能解明は、食品生産、薬理学、生態学など様々な分野の進展を牽引している。オミクス技術が高次元の表現型データを捕捉する一方で、それらをゲノムデータと関連付けることは困難であり、細菌遺伝子の40~60%が未解明のままである。このボトル…
メタゲノム・ビニングのための最近の深層学習手法のいくつかは、高品質なメタゲノムアセンブリゲノムの回収率向上を主張している。これらの手法は、contig embeddings(コンティグの主要な特徴量を固定次元のベクトルに変換する操作を行ったもの)を学習しク…
微生物群集のメタゲノム解析は、メタゲノムアセンブリゲノム(MAG)の再構築により、種間および種内の遺伝的多様性が非常に高いレベルで存在することを明らかにした。MAGデータベース(MAGdb)は、臨床、環境、動物のカテゴリーにまたがる74の代表的な研究論…