macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

GTDB

大量の細菌ゲノムに対するデジェネレートプライマーのPCR増幅効率を評価できる AmpliconHunter

変異プライマー(通常は16Sリボソーム遺伝子領域を標的とする)を用いて生成されたPCR増幅産物のシーケンシングは、複雑な微生物サンプルの分類学的構成をプロファイリングするためにメタゲノミクスで広く用いられている。プライマー選択における分類学的バ…

SingleMによってプロファイリングした公開メタゲノムデータの地理的・生態学的情報を提供する Sandpiper

メタゲノムデータにおける微生物の分類群と相対的豊度の決定は、技術的に依然として困難である。本研究では、普遍的マーカー遺伝子内の保存領域を用いて群集構成を推定する「SingleM」を提案する。ゲノム情報が欠如した種を正確に組み込むことで、未知種がほ…

超高速かつ堅牢なMAGのANI比較を行う skani

メタゲノムアセンブリゲノム(MAG)用のシーケンス比較ツールは、大量のデータや低品質のデータに対処するのが困難である。本著者らは、疎な近似アラインメントを用いて平均ヌクレオチド同一性(ANI)を決定する手法であるskani(https://github.com/bluenot…

検索可能な惑星規模の微生物叢リソース SPIRE

メタオミクスデータは、微生物の多様性と機能に関する情報が公共のレポジトリで指数関数的に蓄積されているが、派生した情報はデータの種類、研究、または採集された微生物環境に応じて孤立した状態で管理されている。ここでは、生息地、地理、系統関係を超…

メタゲノムリードの正確な分類を行う Centrifuger

Centrifugerは、微生物ゲノムデータベースとシーケンスリードを比較する効率的な分類手法である。Centrifugerでは、Burrows-Wheeler変換されたゲノム配列は、ランブロック圧縮と呼ばれる新しいスキームを用いて可逆圧縮される。ランブロック圧縮は線形以下の…

高速かつ低メモリ使用量でメタゲノムプロファイリングやANIサーチを行う sylph

メタゲノムをデータベースと照合してプロファイリングすることで、アセンブルが不可能な低存在量でも微生物の検出と定量が可能になる。本著者らは、ゼロインフレートポアソンk-mer統計量を用いてゲノム間平均ヌクレオチド同一性(ANI)を推定し、ANIに基づく…

シークエンシングリードから直接分類学的プロファイリングを行う MetabuliのGUIアプリケーション(ノートPCでも動作)

MetabuliのGUIアプリがリリースされているので簡単に紹介します。 https://github.com/steineggerlab/Metabuli-App/releases/tag/v1.0.0 "これはMetabuli Appの最初のリリースで、これまでコマンドライン経由でのみ利用可能だったMetabuliメタゲノム分類ツー…

アミノ酸とDNAのジョイント解析による高感度で特異的なメタゲノミックリードの分類器 Metabuli

2024/05/22 追記、誤字修正、コメント追加 2024/08/22 追記 2025/03/04 追記 メタゲノムの分類学的な分類器は、DNA配列かアミノ酸(AA)配列のどちらかを解析する。しかし、Metabuli (https://metabuli.steineggerlab.com)は、DNAとAAの両方を共同で解析し、…

近傍した遺伝子の大規模解析、比較、可視化を行う AnnoView

2024/05/18 論文引用 遺伝子近傍の解析と比較は、微生物ゲノムの構造、機能、進化を探索するための強力なアプローチである。ゲノムの可視化や比較のためのツールは数多く存在するが、大規模なゲノムデータベースやユーザーが作成したデータセットを横断して…

GTDBのtaxonomyとゲノムからKrakenデータベースを作成する GTDB_Kraken

2023/08/11 説明を修正 2024/08/20 追記, kraken1 からkraken2に変更 GTDBでもサードパーティとして紹介されているが、レポジトリGTDB_KrakenでGTDBのリリースR86のkrakenデータベースが公開されている(属レベルでアサインされていない分類 (g__) は排除さ…

GTDBデータベースを扱うためのRustツール xgt

レポジトリより xgtは、GTDBデータベースの効率的なクエリとパースを可能にするRustツール。GTDB APIをミラーリングし、追加のパース機能を提供するコマンドのコレクションで構成されている。 インストール Github #rustcが古いならアップグレードするrustup…

gtdbtkのde_novo_wfコマンド

マニュアルより gtdbtkのde novo ワークフローは、ユーザー提供のゲノムと GTDB-Tk リファレンスゲノムを含むバクテリアと古細菌のツリーを推論する。分類学的な分類を得るにはclassify_wfワークフローを推奨し、de novoでdomain固有のツリーが必要な場合の…

GTDB-Tkのversion 2

2022/05/12 追記、06/03 古いツイートを消去、07/23 preprint引用 2023/10/21 v2.3.2追記 2024/05/09 R220追記、10/26追記 2025/06/07 対応表追加 GTDBとその分類ツールであるGTDB-tkは原核生物ゲノムの分類によく使われるようになりました。しかし、GTDB-tk…

GTDBのオンライン系統樹 AnnoTree

2019 11/6 タイトル修正、説明追加 重要な生物学的および進化的洞察は、種の系統発生にわたる遺伝子および機能的アノテーションの有無を調査することにより生成できる。これらには、予期しない taxonomic occurrences の特定(ref.1)、遺伝子の進化的起源の…

普遍的な single-copy proteinsに基づいてバクテリアとアーキアを分類するGenome Taxonomy Database (GTDB) とその分類ツール GTDB-Tk

2019 10/28 誤字修正、コメント追加、11/5 誤字修正、捕捉追加、11/6 追記 2020 2/21 インストールコマンド修正、3/4 ツイート追加、4/21 インストールの説明を修正、8/23 補足 、9/9 KBase補足、論文リンク追加、12/28 データベースダウンロードリンク更新 …

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正、2/26 コマンドの誤り修正、7/7 インストール説明修正、10/25 論文引用追記、10/29 wgetしてくるデータベースのリンク更新 2020 1/8 コマンドの例修正、2/5 インストールの流れ修正、091/3 wgetしてくるデータベースのリンク更新 202…