macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

metagenome

生態系特異性・機能的遺伝子の探索ができるMAGゲノムのグローバルリポジトリ gcMeta

2025/11/05 誤字修正 メタゲノムシーケンシングの急速な発展により、メタゲノムアセンブルゲノム(MAG)の前例のない膨大なデータが生成され、微生物の発見および機能的特徴づけの機会が一変した。しかしながら、これらの資源を完全に活用することは、データ…

メタゲノム腸内微生物叢プロファイリングによる健康評価のためのwebアプリケーション GMWI-webtool

本著者らは最近、腸内微生物叢の状態から疾患発生の可能性を判定し健康状態を評価する指標として、糞便メタゲノムに基づく「腸内微生物叢ウェルネス指数(GMWI)」を導入した。このウェルネス指数の算出は、健康に有益な種と健康に有害な種の相対的豊かさに…

SingleMによってプロファイリングした公開メタゲノムデータの地理的・生態学的情報を提供する Sandpiper

メタゲノムデータにおける微生物の分類群と相対的豊度の決定は、技術的に依然として困難である。本研究では、普遍的マーカー遺伝子内の保存領域を用いて群集構成を推定する「SingleM」を提案する。ゲノム情報が欠如した種を正確に組み込むことで、未知種がほ…

MSRスケッチングに基づくHiFiリードの高速かつハプロタイプ認識型(aware)のアセンブリを行う Alice

マッピングに適したシーケンス削減(MSR)スケッチを提案する。これは高忠実度(HiFi)ロングリード向けのスケッチ手法であり、これらのスケッチを直接操作するアセンブラ「Alice」を提供する。MSRはコンパクトな表現を生成し、(i) アライン可能な配列(2つ…

MAGから汚染配列を除去するためのマルチモーダル深層言語モデル Deepurify

2025/11/05 追記 メタゲノムアセンブリゲノム(MAG)は、メタゲノムシーケンスデータを用いた微生物のダークマター探索に貴重な知見を提供する。しかし、MAG内の汚染が下流解析の結果に重大な影響を及ぼす可能性に対する懸念が高まっている。現在のMAG除染ツ…

ペタバイト規模の公共配列リポジトリへの効率的かつ正確な検索を行う MetaGraph

公開リポジトリで利用可能な生物学的シーケンスデータの量は急速に増加しており、生物医学にとって重要な資源を形成している。しかし、これらのデータを効率的かつ正確に全文検索可能にすることは依然として課題である。本研究では、大規模なシーケンスセッ…

メタゲノムコンティグのクラスタリング(binning)を行う MetaDecoder

メタゲノムコンティグを潜在的なゲノムにクラスタリングすることは、微生物集団の機能的役割を調査する上で重要なステップである。既存のアルゴリズムは、シミュレーションまたは実際のシーケンスデータセットでかなりの成功を収めている。しかし、複雑なメ…

包括的な高品質MAGのデータベース MAGdb

微生物群集のメタゲノム解析は、メタゲノムアセンブリゲノム(MAG)の再構築により、種間および種内の遺伝的多様性が非常に高いレベルで存在することを明らかにした。MAGデータベース(MAGdb)は、臨床、環境、動物のカテゴリーにまたがる74の代表的な研究論…

ゲノムアセンブリからウイルスゲノムを発見して正確なアノテーションをつける Cenote-Taker 3

ウイルスは地球上のあらゆる環境に豊富に存在し、あらゆる細胞生物を感染させる。にもかかわらず、ウイルスはゲノム科学者にとって一種のブラックボックスである。その遺伝的多様性は他の全ての生命体を合わせたものよりも大きく、そのゲノムはシーケンシン…

全SRAデータをインデックス化して塩基/タンパク質の配列検索を可能にした LoganとLogan Search

2025/09/09 タイトル修正 生命の多様性の広がりは計り知れないが、公開されている核酸配列データは地球規模での遺伝的多様性の分散と進化を垣間見せる。しかし配列データの急速な増加と蓄積は、効率的な解析能力を凌駕している。自由に利用可能なシーケンス…

メタゲノムデータから株レベルの多様性を検出する metaSNV

微生物群集の分類学的解析は、種および株レベルで十分に支持されている。しかし、種内には顕著な表現型の多様性が存在し、株は世界的な集団間で広く共有されることは稀である。種と株の間の多様性を層別化することで、「>亜種」と呼ばれる有用な中間層を特定…

ロングリードメタゲノムの解析と評価のためのsnakemakeパイプライン (MAEPLR)

(Prepirntより) メタゲノムアセンブリは、微生物生態系のシーケンシングデータから高品質なゲノムをできるだけ多く再構築することを目的としている。Hi-Fiロングリードなどのアセンブリを容易にする技術的進歩があるにもかかわらず、数百から数千の集団が混…

超高速かつ堅牢なMAGのANI比較を行う skani

メタゲノムアセンブリゲノム(MAG)用のシーケンス比較ツールは、大量のデータや低品質のデータに対処するのが困難である。本著者らは、疎な近似アラインメントを用いて平均ヌクレオチド同一性(ANI)を決定する手法であるskani(https://github.com/bluenot…

メタゲノムの菌叢存在量を株レベルで正確に定量する StrainR2

合成微生物群集は、管理可能なモデルシステムにおいて還元主義的研究を行う機会を提供する。しかし、これらの群集内における高度に類似した株のアバンダンスを推定することは、現在信頼性が低い状態になっている。16S rRNA遺伝子シーケンシングは株レベルで…

検索可能な惑星規模の微生物叢リソース SPIRE

メタオミクスデータは、微生物の多様性と機能に関する情報が公共のレポジトリで指数関数的に蓄積されているが、派生した情報はデータの種類、研究、または採集された微生物環境に応じて孤立した状態で管理されている。ここでは、生息地、地理、系統関係を超…

ロングリードのメタゲノムアセンブラ myloasm

2025/09/09 プレプリント引用 ロングリードメタゲノムアセンブリは、マイクロバイオームからの完全なゲノム復元を約束する。しかし、メタゲノムの複雑性は課題をもたらす。本著者らは、PacBio HiFiおよびOxford Nanopore Technologies (ONT) R10.4ロングリー…

メタゲノムリードの正確な分類を行う Centrifuger

Centrifugerは、微生物ゲノムデータベースとシーケンスリードを比較する効率的な分類手法である。Centrifugerでは、Burrows-Wheeler変換されたゲノム配列は、ランブロック圧縮と呼ばれる新しいスキームを用いて可逆圧縮される。ランブロック圧縮は線形以下の…

類似した株のマッピング識別のため存在量を考慮したメタゲノムリードの再割り当てを行う Mora

メタゲノムシーケンスによって微生物コミュニティを解析する場合、基本的なタスクは、特定のシーケンスリードがどの参照ゲノムに由来するかを決定することである。これにより、微生物の組成に関する情報が得られ、遺伝的変異のマッピングベースの解析が可能…

ナノポアリードからの高品質メタゲノムアセンブリを行う nanoMDBG

第3世代のロングリードシーケンス技術は、メタゲノムアセンブリの質を著しく向上させることが示されている。PacBio HiFiで生成された高精度のリードを用いた結果は特に注目すべきもので、手作業なしで数百の環状化された完全なゲノムをメタゲノムアセンブリ…

メタゲノムデータのLCA推定と分類学的プロファイリングを行う ngsLCA 

環境サンプルから生成されたメタゲノム・データは、現代および古代の生物群集の解析においてますます一般的になってきている。この種のデータから分類学的プロフィールを得るためには、DNA配列を大規模なゲノム参照データベースに対してアラインメントし、各…

ONT/PacBioのロングリードのメタゲノムアセンブリとbinningパイプライン mmlong2

mmlong2はNanoporeまたはPacBio HiFiシーケンスデータから原核生物ゲノムを自動回収・解析するゲノム中心のロングリードメタゲノミクスワークフローである。mmlong2ワークフローはmmlongを継承している。mmlong2はロングリード専用のワークフローであり、Nan…

メタゲノム配列プロファイリングのためのMinimizerベースのナイーブベイズ分類器 MNBC

メタゲノムシーケンスリードを分類するための最先端のツールは、迅速かつ正確な選択肢を提供するが、単一のツールで両者を組み合わせることは、常に改善される研究分野である。機械学習ベースのNaïve Bayes Classifier (NBC)アプローチは、サンプル内のすべ…

シークエンシングリードから直接分類学的プロファイリングを行う MetabuliのGUIアプリケーション(ノートPCでも動作)

MetabuliのGUIアプリがリリースされているので簡単に紹介します。 https://github.com/steineggerlab/Metabuli-App/releases/tag/v1.0.0 "これはMetabuli Appの最初のリリースで、これまでコマンドライン経由でのみ利用可能だったMetabuliメタゲノム分類ツー…

ロングリードメタゲノムアセンブリから株レベルのphasingアセンブリを行う Strainy

微生物群集に含まれる細菌種は、ゲノムの小さな変異によって区別される菌株の混合物であることが多い。ショートリード法は、菌株間の小規模な変異を検出するために使用できるが、これらの変異を連続したハプロタイプにphasing(位相を揃える)することはでき…

特定の分類群に特化したDBを使うことでkrakenのリソース使用量を減らす

2024/08/26 誤字修正 Kraken2はシークエンシングリードから菌叢解析を行うプログラムです。事前に作成されたRefSeq完全長ゲノムのDBなどを使って、シークエンシングリードの超高速な分類学的分類を実行できます。 kraken2はkraken1と比べてメモリ使用率が大…

生のメタゲノムシークエンシングリードからターゲットのタンパク質を読んだリードを同定する Lapidary

ゲノムおよびメタゲノムの比較は、サンプル間で異なる、または共通する遺伝的エレメントを同定することに依存している。これらの遺伝的エレメントは、シークエンシングリードをアセンブルし、アセンブリ中の遺伝的エレメントを同定することによって、または…

メタゲノムアセンブリゲノムの品質を評価するパイプライン MAGqual

微生物群集の全ゲノム配列を決定するメタゲノミクスは、複雑な生態系に対する洞察を提供してきた。新規微生物の発見を容易にし、群集の相互作用を説明し、様々な分野で応用されている。ハイスループットと第3世代シーケンシング技術の進歩は、その普及にさら…

メタゲノムアセンブリの高精度なbin refinementツール Binette

2024/04/24 誤字修正, 11/5 インストール手順修正、11/6 追記 メタゲノム解析は、ショットガンシーケンスによる微生物群集とその個々のメンバーの研究を可能にする。メタゲノム解析に不可欠な段階は、メタゲノムアセンブリゲノム(MAG)の回収である。メタゲ…

複雑なメタゲノムおよびメタトランススクリプトームデータをアセンブルする PenguiN

メタゲノミクスは、環境およびヒトに関連する微生物群集を研究するための強力なアプローチであり、特に、それらの形成におけるウイルスの役割を研究するためのアプローチでもある。ウイルスゲノムは、高い突然変異率によるゲノムの多様性のため、メタゲノム…

(メタ)ゲノムのARGプロファイリングを行うSnakemakeパイプライン ARGprofiler

メタゲノム解析は、抗菌薬耐性遺伝子(ARG)の機能や分布を理解する上で非常に有用である。しかし、研究の比較可能性を確保するために、標準化された再現可能なワークフローが必要である。現在の選択肢には、それぞれ特定の目的を念頭に設計された様々なツー…