macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ANI

ANIについて

2024/03/04 誤字修正、03/05 引用追加、文章校正 このブログでこうゆう話を書くのは珍しいのですが、今日は自分も良く使っているANIについてなるべく分かりやすく説明します。 2つの菌のゲノムDNA間を比較するAverage Nucleotide Identity (ANI) 比較は、we…

メタゲノムロングリードの分類学的分類と定量を行う Melon

ロングリードシーケンスは、複雑な微生物群集の特徴を明らかにする上で大きな可能性を秘めているが、ロングリード専用に設計された分類学的プロファイリングツールはまだ不足している。ここでは、ロングリードのユニークな特性を生かしたマーカーベースの分…

メタゲノムの微生物の存在/不在を検出するANIベースの統計テスト YACHT

採取したDNAから環境に関連する微生物群集を研究するメタゲノミクスにおいて、最も基本的な計算タスクの1つは、リファレンスデータベースから、与えられたサンプルメタゲノムにどのゲノムが存在するか、または存在しないかを決定することである。この問いに…

(メタ)ゲノムアセンブリをANIでクラスタリングする galah

(レポジトリより) Galahは、よりスケーラブルなメタゲノムアセンブリゲノム(MAG)デレプリケーション法を目指している。すなわち、微生物ゲノムをANIに基づいてクラスタリングし、各クラスタの中から1つのメンバーを代表として選択するものである。 Galah…

真核生物ゲノムの自動アノテーションを行うMOSGAのメジャーアップデート

利用可能なゲノム情報の数が非常に増えているため、アクセスしやすく、使いやすい解析ツールの必要性が高まっている。真核生物のゲノムアノテーションを容易にするために、本著者らはMOSGAを作成した。この研究では、ゲノムデータに対するいくつかの高度な解…

スケーラブルなインフラ上での比較ゲノミクスサービス EDGAR3.0

EDGARプラットフォームは、何千もの微生物ゲノムの事前計算されたオルソロジーデータのデータベースを提供するウェブサーバーで、比較ゲノミクスおよび系統学の分野で最も確立されたツールの一つである。EDGARは、事前に計算された遺伝子アラインメントに基…

ANIを計算する改善されたアルゴリズム orthoani

細菌・古細菌における種の分類は、主にゲノム全体の関連性に基づいて行われており、現代の微生物学の枠組みとなっている。現在、2つの系統間の類似度は、実験的に決定されたDNA-DNAハイブリダイゼーション(DDH)による類似度から、ゲノム配列に基づく類似度…

(プロテイン)レシプロカルベストヒットを抽出する getRBH.pl

タンパク質配列の迅速な比較のためのソフトウェアの著者は、そのソフトウェアの速度を評価し、その結果をそのタスクのための最も一般的なソフトウェアと比較しているが、より特殊な用途、例えば、Reciprocal Best Hit(RBH)としてのオルソログの発見のよう…

バクテリアゲノムの比較ゲノム解析を行うwebサービス EDGAR

2022/03/28 URL 更新, POCP matrix追記 Bergey's Manual of Systematics of Archaea and Bacteriaより 次世代シークエンシングアプローチの展開により、完全にシークエンシングされたゲノムの数は急速に増加している。その結果、単一ゲノムだけでなく、関連…

anvi'oのパンゲノム解析でヒートマップを追加する

Prochlorococcus Metapangenome - Anvi'o Server anvi'oは様々な解析方法や表現方法をサポートするマルチオミクス解析パッケージである。その機能の1つに、パンゲノムやメタゲノム(binned.fasta)のgenomic ANIを総当たりで計算し、 anvi'oマップにヒートマ…

計算リソースを効率的に使って多数のよく似たバクテリアゲノムを素早く分析する自動化されたパイプライン Bactopia

2020 3/17 パラメータ追記、コマンド修正、タイトル修正 2020 3/18 追記 2020 5/11 説明追加 2020 8/13 論文追記 2020 12/9 ツイート追加 2021 2/24アップデートされたコマンドに修正 2021 10/7 ツイート追加 イルミナのテクノロジーを使用した細菌ゲノムの…

ベストマッチするリファレンスゲノムを探す ReferenceSeeker

2020 3/8 コメント削除、タイトル修正 公共データベースで利用可能な微生物ゲノムの数は増え続けており、多くのin-silico分析、例えば 一塩基多型の検出、scaffolding、比較ゲノミクス、に必要なリファレンスゲノムの最適な選択がますます困難になってきてい…

普遍的な single-copy proteinsに基づいてバクテリアとアーキアを分類するGenome Taxonomy Database (GTDB) とその分類ツール GTDB-Tk

2019 10/28 誤字修正、コメント追加、11/5 誤字修正、捕捉追加、11/6 追記 2020 2/21 インストールコマンド修正、3/4 ツイート追加、4/21 インストールの説明を修正、8/23 補足 、9/9 KBase補足、論文リンク追加、12/28 データベースダウンロードリンク更新 …

微生物ゲノムアセンブリの品質と比較ゲノミクス(correspondence要約)

私(論文のオーサー;hereafter、私)の最近の研究では、低品質の細菌ゲノム配列(ここでは「多くのコンティグを含むゲノム配列アセンブリ、最終的には明らかなミスアセンブリと未解決のプラスミド配列」と定義)を扱ってきた。主要な問題は、ゲノムのクオリ…

ゲノムをダウンロードして総当たりANI比較を実行する pyani

2020 2/12 タイトル修正 2020 2/20 コメント追加 2020 2/25 インストール手順修正 2020 10/5 コマンド微修正 2020 10/9 インストール微修正 このモジュールはいくつかの代替方法のうちの1つに従って平均ヌクレオチド同一性ANIを計算する。ANIは、DNA-DNAハ…

バクテリアとアーキアのデータベース EzBioCloud

2019 7/5 関連ツール追記について追記 現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシ…

all vs allでgANIを計算する pANIto

ANI

インストール mac os10.12で動作テストを行った。 ビルド依存 Ensure you have a standard development environment installed (e.g. gcc, automake, autoconf, libtool). 本体 Github #homebrewで導入できるbrew install tseemann/bioinformatics-linux/pan…

複数メタゲノムアセンブリのアセンブリ精度を比較して、種レベルでユニークな配列セットを得る dRep

2019 5/7 インストール追記、6/16 パラメータ追記、6/16 upしたdocker イメージのエラー修正、6/18 link追加 2021 4/29 インストール追記、5/18 インストール追記 (condaによるpplacerの導入)、5/27 タイトル変更、5/29, 6/30 compareコマンド追記 2022/06/…

Kostabl labのANIやAAIを計算するwebツール (enveomicsコレクションの一部)

ゲノムおよびメタゲノム解析は、生物学的研究のいくつかの分野でますます一般的になってきているが、頻繁に繰り返される特殊な分析は、論文のpublish後にはほとんど利用できないin-houseスクリプトとして報告されている。著者らは、微生物ゲノミクスおよびメ…

MinHashを使った高速なANI計算ツール fastANI

2019 1/09 cocndaインストール追記 ,2/12 不要な文を削除, 4/12 dockerリンク追加 2020 4/2 インストール手順修正2022 03/28 help更新 さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は…

gANIを計算するツール ANIcalculator

微生物は数と多様性の両方で生命の樹木を支配しており、その自然分類を困難かつ重要なものにしている。動物では、種は一般に交配可能な生物群と定義されるが(biological species concept)、この定義は無性生物の集合体に直接適用することはできない。結果…

ANItoolsをwebで実行できるANItools web

単離されたバクテリア株の迅速かつ正確な分類は、医療微生物学、特に全国的または全世界的な広がりの脅威を伴う感染症発症中の最も重要な課題である(論文より ref.1)。しかし、現在の分類方法はすべて、表現型の類似性や化学的性質に基づく方法のみならず…

MinHashを使いfasta / fastqから生物種を高速推定する BBSketch

2019 6/13 追記 2019 7/18 インストール追記 2020 7/7 コマンド追記、help 更新 2020 7/9 文章追記 以前このブログで紹介したBBtoolsに、Minhashアルゴリズム(リンク)を使ってわずか数秒でゲノムなどの大きな配列を比較し、トップヒットを返してくれる機能…

複数のトランスクリプトーム解析からコア遺伝子を探索するGET_HOMOLOGUES-EST

2018 9/27 引用の誤り修正 2020 4/13 インストール手順とヘルプ追記, タイトル修正 2020 4/14 インストール手順修正 2020 5/27 タイトル修正 種のパンゲノムとは、その種のすべての個体に見られるすべての遺伝子とノンコーディング配列の集合体と定義される…

Pacbioロングリードのシミュレーター PBSIM

2019 7/28 condaインストール追記 PBSIMはPacbioリードのシミュレーションを行うツール。ユーザーの持っているPacbioデータをもとにリードの長さやクオリティをシミュレートすることもできるため、実際の解析に適用しやすい。 インストール GitHub - pfaucon…