macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

MInHash

計算リソースを効率的に使って多数のよく似たバクテリアゲノムを素早く分析する自動化されたパイプライン Bactopia

2020 3/17 パラメータ追記、コマンド修正、タイトル修正 2020 3/18 追記 2020 5/11 説明追加 2020 8/13 論文追記 イルミナのテクノロジーを使用した細菌ゲノムのシーケンシングは、多くの場合、扱いやすい分析手法よりも速くデータが生成される手順になって…

ラップトップでも軽快に動作するゲノム比較ツール bindash

ゲノム(メタゲノムを含む)の数は加速的に増加している。 近い将来、数百万のゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

elprep 4

elPrep 4はelPrep [ref.1]の大幅に拡張された再実装であり、DNAシーケンシングパイプラインでのバリアントコールのシーケンスアライメント/マップファイル(SAM / BAM)[ref.2]を準備するためのマルチスレッドツールである。パイプラインでどの準備ステップ…

サンプルのコンタミネーションを見積もる Mash Screen

2019 11/5 論文追加 シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さ…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

ゲノムスキミングサンプルから種を同定する Skmer

環境サンプルの分類学的多様性を迅速かつ安価に研究する能力は、急速な気候変動と生物多様性の変化が起きているこの時代において非常に重要である。現在選択されている分子技術は、(meta)Barcoding[論文より ref.1- 3]である。伝統的な(meta)Barcodingは…

Minhashを使い、genomic DNA / proteinを高速比較する sourmash

2019 7/5 インストールエラー修正 2019 10/2 twitter追記 2020 1/5 twitter追記 2020 2/4 twitter追記 2020 2/20 コマンド修正 2020 2/27 help更新, コマンド修正 2020 5/5 twitter追記 sourmashは、ゲノムデータのMinHash sketchesを作成、比較、操作するた…

たくさんのスモールゲノムを比較したり、複数メタゲノムアセンブリのde-replicationを行う dRep

2019 5/7 インストール追記 20196/16 パラメータ追記 20196/16 upしたdocker イメージのエラー修正 2019 6/18 link追加 メタゲノム研究により、シーケンシングされ、ドラフト品質ゲノムが解読される微生物ゲノムの数は毎年急速に拡大している。大きなゲノム…

MinHashを使った高速なANI計算ツール fastANI

2019 1/09 cocndaインストール追記 2019 2/12 不要な文を削除 2019 4/12 dockerリンク追加 2020 4/2 インストール手順修正 さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は、微生物生態…

k-merを使い 進化距離や相同性を高速計算する Kmer-db

Preprintより 何千もの異なる生物のシーケンシング解析の過程で大量のデータが生成された(100K Pathogen Genome Project(Weimer el al、2017、NCBI Pathogen Detection(https://www.ncbi.nlm.nih.gov/ pathogens) )、これは迅速な分析方法を要求する。 …

MinHashを利用した長い配列(ゲノムやロングリード)のアライナー MashMap

2018 タイトル修正 2019 6/21 インストール追記、論文追記 2020 10/19 help更新、文章修正 ハイスループットDNAシーケンサーによって生成されたリードをリファレンスゲノムにマッピングすることは、根本的かつ広く研究されている課題である[Preprintより ref…

MinHashを使い高速にゲノムを比較する MASH

2019 4/12 dockerリンク追加 BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超えるシーケンス生成が可能である[re…

MinHashを使いfasta / fastqから生物種を高速推定する BBSketch

2019 6/13 追記 2019 7/18 インストール追記 2020 7/7 コマンド追記、help 更新 2020 7/9 文章追記 以前このブログで紹介したBBtoolsに、Minhashアルゴリズム(リンク)を使ってわずか数秒でゲノムなどの大きな配列を比較し、トップヒットを返してくれる機能…