macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

taxonomic assignment

mOTUs3を使ってロングリードの分類学的プロファイリングを行う

krakenに代表されるメタゲノムの分類学的プロファイリングツールは、fastqのそれぞれのReadに対してダイレクトに分類学的分類を行う。そのために、kraken1ではJellyfishを使ってリファレンスゲノムからk-merが取り出され、ゲノムの分類学的情報と共にデータ…

系統マーカー遺伝子に分類群を割り当てる AmphoraNetと結果を視覚化するAmphoraVizu

メタゲノム解析はここ数年、目覚しい発展を遂げた。今日、遺伝子配列決定の専門家だけでなく、他の専門分野の多くの研究室が、臨床サンプルや環境サンプルから得られたDNA配列を解析する必要がある。メタゲノム解析データの系統解析は、生物学者やバイオイン…

Sourmashのgatherコマンド

Sourmash helpより Sourmashのサブコマンド `gather` は、メタゲノム解析で最適なリファレンスゲノム(のシグネチャファイル)をリファレンスゲノムデータベースから選択する。 k-merは非常に特異的なので、Sourmash gather は、過去にシークエンシングされ…

MMseqs2 コマンド其の4 分類群をアサインする mmseqs taxonomyコマンド

今年出た論文(*1)より MMseqs2 taxonomyは、メタゲノムのコンティグに分類学上のラベルを付与する新しいツールである。各コンティグから可能性のある全てのタンパク質断片を抽出し、分類学的なアノテーションに貢献できるものを素早く取り出し、それらにロ…

de novo transcriptomeの系統解析と機能解析を行うwebツール TRAPID 2.0

2021 10/1 論文引用 ハイスループットシーケンシングの進歩は、RNA-Seqトランスクリプトームデータの膨大な増加をもたらした。しかし、特定の組織、状態、単細胞生物、微生物群集での迅速な遺伝子発現プロファイリングが期待されているが、新たな計算上の課…

バクテリアとアーキアの正式名称やタイプストレイン情報などを掲載するデータベース LPSN

2020 9/3、9/6 誤字修正 1997年の論文 このリストには、International Journal of Systematic Bacteriologyに掲載された細菌の正式名称がアルファベット順に年代順に掲載されている。5,569種(1996年12月31日現在)を網羅しており、インターネット上で入手可…

Linnean分類システムのランクに応じて分類学の系統を提供する分類学データベース Taxallnomy

あらゆる生物学的データは分類学的データと密接にリンクしており、いくつかのバイオインフォマティクス分析は目的を達成するために分類学的情報に依存している。メタゲノミクス、臨床法医学、その他の分野では、サンプル中に存在する生物を同定し、グループ…

計算リソースを効率的に使って多数のよく似たバクテリアゲノムを素早く分析する自動化されたパイプライン Bactopia

2020 3/17 パラメータ追記、コマンド修正、タイトル修正 2020 3/18 追記 2020 5/11 説明追加 2020 8/13 論文追記 2020 12/9 ツイート追加 2021 2/24アップデートされたコマンドに修正 2021 10/7 ツイート追加 イルミナのテクノロジーを使用した細菌ゲノムの…

オルソログのPhylogenetic profiles分布を視覚化する PhyloProfile

Phylogenetic profilesは、種間の遺伝子の有無パターンを捕捉する(Pellegrini et al、1999)。特定の種にオルソログが存在することは、対応する機能も表されていることの証拠となることがよくある(Lee et al、2007)。さらに、2つの遺伝子がそのPhylogenet…

最新のデータベースを使ってメタゲノムのリードのtaxonomic assignmentを行う ganon

リファレンスおよびtaxonomyに基づくショートリードの分類は、メタゲノムの基本的なタスクである。 シーケンス後に行うことができる環境サンプルからの各リードの起源の定義は、通常は量の推定、プロファイリング、およびアセンブリ前の最初のステップである…

メタゲノムアセンブリから真核生物由来配列を予測する EukRep

真核微生物は生態系機能の重要な貢献者である。微生物群集の中の真核生物を特定するために遺伝子調査またはDNA「バーコード」が頻繁に使用され、真核生物の多様性の幅が示されている(Pawlowski et al、2012)。ただし、これらのアプローチでは種を検出する…

包括的なメタゲノム解析パイプライン MAGO

微生物種はさまざまな環境で重要な役割を果たしているが、メタゲノムデータセットからの高品質のゲノムの生成は、その生態学的および進化のダイナミクスを理解する上で大きな障害となっている。 Metagenome-Assembled Genomes Orchestra(MAGO)は、複数のマ…

普遍的な single-copy proteinsに基づいてバクテリアとアーキアを分類するGenome Taxonomy Database (GTDB) とその分類ツール GTDB-Tk

2019 10/28 誤字修正、コメント追加、11/5 誤字修正、捕捉追加、11/6 追記 2020 2/21 インストールコマンド修正、3/4 ツイート追加、4/21 インストールの説明を修正、8/23 補足 、9/9 KBase補足、論文リンク追加、12/28 データベースダウンロードリンク更新 …

包括的なメタゲノム解析パイプライン ATLAS

2019 10/26関連ツール追加、10/26 インストール手順修正、10/29 同上、10/29 コメント追加 2020 6/28 論文とツイート追記、実行手順は確認中、2/7, 4/27, 4/29 インストール手順とラン手順追記 2021 5/1 dockerインストール追記、5/12 バグ修正手順追記(非…

Metagenomic contigsの分析と可視化のための自動化されたパイプライン MetaErg

2019/10/24 MetaCycの結果追記 2021 1/27 誤字修正 ゲノムアノテーションは、文字通り、アセンブリされたDNA分子の特徴の注釈である。そのような特徴は、そもそも、タンパク質をコードする遺伝子[「オープンリーディングフレーム」(ORF)]およびリボソーム…

microbiome研究のためのプラットフォーム iMicrobe

iMicrobeは、研究者自身のデータを公開し、精選された微生物のメタゲノムデータセットと分析のための高性能コンピューティング(HPC)メソッドに接続するプラットフォームである[ref.1]。過去10年間で、シーケンシングのコストはムーアの法則をはるかに上回…

prokaryotic virusのcontigをクラスタリングしTaxonomic assignmentを行う vContact2

2019 9/25 誤字修正 細菌と古細菌は、海洋と土壌の生態系での栄養とエネルギーのサイクルに役割を果たしており、人間の健康にも重要な役割を果たしている。細菌や古細菌に感染するウイルスは、殺害、代謝再プログラミング、または遺伝子導入によってこれらの…

包括的なfunctional annotationを行うwebツール FunctionAnnotator

シーケンス技術の向上により、次世代シーケンス(NGS)がトランスクリプトーム研究にますます頻繁に使用されている。適切なリファレンスゲノムがないため、非モデル生物のトランスクリプトームの分析はモデル生物のトランスクリプトームと非常に異なる。 Tri…

シングルの配列やメタゲノムのbinned.fastaのtaxonomic classificationを行う BASTA

2019 7/13 説明修正 2019 8/1 説明追記 2020 1/21 インストール手順修正 2020 2/4 データベースダウンロード手順修正 2020 4/17 コマンド修正 2020 4/19 binned fastaを使う手順追記 DNAシーケンシング、例えばアンプリコン、メタゲノムおよび全ゲノムシーケ…

タイプ株を中心にバクテリアの表現型情報をまとめたデータベース BacDive

2020 10/16 タイトル変更、誤字修正 2021 10/7 画像一部更新 原核生物は、研究開発との関連性が高い多種多様な表現型形質を発現する。バクテリアのメタデータのホットスポットとしてよく利用できるのは、最初の(一次)文献で報告された種の説明と、生物資源…

複数のメタゲノムをその場で分析するための軽量で多機能なメタゲノム分析ツール SqueezeMeta(オフライン使用)

2020 11/19 condaインストール追記 シーケンシング技術の改良によりメタゲノムシーケンシングが一般化し、メタゲノムシーケンシングがマイクロバイオームの構造および機能性を分析するための標準的な手順となった。メタゲノム実験によって生成された膨大な数…

メタゲノムのraw fastqから高速なtaxonomy assignmentを行う FOCUS

微生物は他のどの細胞生物よりも豊富であり(Whitman、Coleman&Wiebe、1998年)、どの生物が存在し、それらが何をしているのかを理解することが重要である(Handelsman、2004)。多くの環境では、微生物群集の大多数は培養できず、メタゲノムは未培養のゲノ…

種の形質をコレクションするデータベース Traitpedia

種はそれらの遺伝子型および表現型によって一義的に定義することができる。この遺伝子型および表現型は非常に密接に絡み合っており、追加の環境コンポーネントがこの関係の広い理解を複雑にしている。表現型、または形質は、生物の遺伝情報にある程度依存し…

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正、2/26 コマンドの誤り修正、7/7 インストール説明修正、10/25 論文引用追記、10/29 wgetしてくるデータベースのリンク更新 2020 1/8 コマンドの例修正、2/5 インストールの流れ修正、091/3 wgetしてくるデータベースのリンク更新 202…

メタゲノムデータからrRNAをターゲットアセンブリし、系統アサイン、定量、比較する phyloFlash

2019 5/9 インストール追記 2020 6/11 インストール方法修正 2020 6/16 trusted contigのコマンド追記 2020 10/28 論文追記 2023/05/10 ツイート追記 ショットガンメタゲノミクスは、微生物群集の機能を調査し、それらの系統または分類学的な構成を決定する…

植物RNA seqシーケンシングデータからvirusリードを検出する kodoja

Kodojaはk-merプロファイリングを使用してRNA-seqまたはsRNA-seのfastq/fasta生データからウイルス配列を特定するツール。 k-merを用いた系統分類ツールKrakenとおよびタンパク質レベルでの配列マッチングのKaijuを組み合わせている(Burrows-Wheeler変換し…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

nrなどのNCBIデータベースをダウンロードする ncbi-blast-dbs

2018 12/10 タイトル訂正 2020 9/7追記2020 9/11 わかりにくい説明を修正、9/11 簡単な並列処理例追記、9/12.9/15 taxonkit コマンド修正, わかりにくい部分を修正、10/3 taxonkitのコマンドを修正、10/10 コマンド微修正、10/28 誤字修正 2022 1/6 例のパラ…

メタゲノムデータのtaxonomy assignmentを行う k-SLAM

微生物群集から直接抽出されたDNAの研究は、全ゲノムショットガンシーケンシングによって革命を起こした。バクテリア、ウイルス、真菌の種から数十億の短いDNA配列をサンプリングする能力は、多様な生態系の分類学的構成ならびにその中で起こっている過程を…

複数のbiningツールを統合し、包括的なメタゲノム解析を行うパイプライン metaWRAP

2018 タイトル修正, 説明追加, step5エラー修正 2019 データベース作成ケアレスミス修正, ヒートマップ追加, インストールコマンド修正 2020 gzip圧縮fastqは使えないことを追記, インストール手順修正, salmonの定量ステップ修正 2021 4/27,4/28 dockerリン…