de brujin graphからinversionのブレイクポイントを検出する TakeABreak

構造変化はゲノム変化の重要なソースであり、表現型の変化、遺伝性疾患、進化に関与する可能性がある。集団における構造的変異の程度は、主にNGSのおかげで、最近になって認められているに過ぎない。事実、いくつかのヒト個体のゲノムをシーケンシングするこ…

2018-11-19

Minhashを使い、genomic DNA / proteinを高速比較する sourmash

MInHash ゲノム比較 (comparative genomics) 高速なツール結果の視覚化 (visualization) 系統解析 Bioconductor genetic distance k-mer protein search 2019 F1000Research AAI

2019 7/5 インストールエラー修正、twitter追記 2020 1/5 twitter追記、2/4 twitter追記、2/20 コマンド修正、2/27 help更新, コマンド修正、5/5 twitter追記 2022/04/15 コマンド例を追加 sourmashは、ゲノムデータのMinHash sketchesを作成、比較、操作す…

2018-10-25

大きなk-merも使うde Bruijn graph のアセンブリツール SKESA

2018 Genome Biology assembly k-mer 高速なツール benchmark docker

2019 4/12 dockerリンク追加 NGSデータを分析するためのシーケンスアライメント、アセンブリ、変異検出、またはそれらのいくつかの組み合わせは、通常、バイオインフォマティクスパイプラインの主要なモジュールである[論文より ref.1,2,3,4,5,6]。微生物ゲ…

2018-10-08

LightAssembler

2016 Bioinformatics assembly k-mer 高速なツール

次世代シークエンシング（NGS）技術の出現はゲノム研究に革命をもたらしたが、シーケンスされた生物の全体像を提供することはできていない。なぜなら、数十億のフラグメント断片の相対位置はゲノムアセンブリなしでは分からず、それらは非常にあいまいな重複…

2018-08-31

バクテリオファージのホストを推測する HostPhinder

2016 Viruses virus k-mer web tool GUIツール CRISPR

2012年、世界保健機関（WHO）は抗生物質時代の終焉の始まりと、ささいな細菌感染でさえ致命的になる時代に戻りうることを発表した[論文より ref.3]。それ以来、抗生物質耐性の問題は増大し続けており、WHOレポート「Antimicrobial resistance: global report…

2018-07-21

小メモリで高速にtaxonomy assignmentを行う metacache

生物種の推定 (taxonomic profiling) metagenome 高速なツール k-mer 2017 Bioinformatics taxonomic assignment

メタゲノム研究の例として、ヒト腸のシーケンシング解析（Korpela et al、2016）、ヒトの皮膚（Bzhalava et al、2014）、水生生態系（Bork et al、2015）、食物（Ripp et al、2014 ）、土壌（Fierer et al、2012）および空中の微生物（Barberánet al、2015）…

2018-07-13

k-merを使い進化距離や相同性を高速計算する Kmer-db

k-mer 高速なツール genetic distance 生物種の推定 (taxonomic profiling) ゲノム比較 (comparative genomics) MInHash

Preprintより何千もの異なる生物のシーケンシング解析の過程で大量のデータが生成された（100K Pathogen Genome Project（Weimer el al、2017、NCBI Pathogen Detection（https://www.ncbi.nlm.nih.gov/ pathogens））、これは迅速な分析方法を要求する。 …

2018-07-12

Fermi-lite

assembly k-mer library

Fermi-liteはHeng Liさん（wiki）がGithubで公開されているスタンドアロンのCライブラリ。イルミナのショートリードを100bpから1,000万bpの領域でアセンブリするコマンドラインツールとしても機能する。Fermi-liteはオーバーラップベースのアセンブリを行う…

2018-07-07

somaticとgermlineのバリアント検出ツール Scalpel

local assembly tumor small indel family trios k-mer human whole genome human genome family germline human exome 2014 Nature Methods

注: docker イメージのリンクも紹介してますが、テストするとエラーを吐きました。condaを使いlinuxマシンでに導入するのが無難なようです。 SNVsの分析はヒト遺伝学を研究するための標準的な技術となっているが[論文より ref.1]。、DNA配列（indels）の挿入…

2018-07-02

抗生物質耐性遺伝子を検出する KmerResistance

生物種の推定 (taxonomic profiling) bacteria clinical and diagnostic k-mer 抗生物質耐性遺伝子 (ARGs) web tool AMR

抗生物質は、ヒトおよび家畜の両方で世界中で広く使用されており、疾患の治療または急速な成長を保証している。長年にわたり、これは抗生物質耐性菌の出現、選抜および普及のための好ましい条件を作り出してきた（ref.1）。バクテリアの耐性プロファイルを…

2018-06-24

SPAdesのアセンブリを改善する Shovill

assembly k-mer bacteria

2019 7/16 インストールの説明の誤りエラー修正 2019 9/25 twitterリンク追加 2019 10/25 dockerリンク追加 SPAdesゲノムアセンブラは、バクテリアや他の真核微生物（主に1倍体）のIlluminaホールゲノムシーケンシング（WGS）データのデファクトスタンダード…

2018-06-21

自動でコンタミネーションを除く ProDeGe

contamination single cell k-mer assembly

最近の技術的進歩によりハイスループット配列決定シーケンス解析が可能になり、難培養微生物のsingle amplified genomes（SAG; Rinke et al。、2013 ; Swan et al。、2013 ）やメタゲノムのアセンブリおよびbinningが可能になった（GMGs; Cuvelierら、2010 ;…

2018-06-18

(RNA seq) 複数のde novoアセンブリ結果をマージし、冗長なcontigを除く DRAP

RNA seq assembly sequence clustering k-mer evaluation tool

第二世代シークエンシングプラットフォームは、多種多様な種および条件の遺伝子発現を分析することを可能にする、多量の転写産物のシーケンスデータの生成を可能にした。リファレンスゲノム配列を欠く種については、現在の古典的なプロセシングパイプライン…

2018-06-17

polyploidのラージゲノムのアセンブラ Meraculous2

human genome polyploid 高速なツール assembly haplotype k-mer large genome

ヒトや他のギガベース規模のゲノムの正確なディープショットガンシーケンスは、今や控えめなコストで容易に利用可能になっている。これらのシーケンシングスループットの増加により、大規模かつ複雑なゲノム用のショットガンシーケンスを構築するための新し…

2018-06-17

DACCOR

repetitive sequences k-mer

シーケンシングリードからのゲノムの再構築は、デノボアセンブリによって達成でき、重複したリードが同定され、コンティグと呼ばれるより長い連続配列に拡張される。あるいは、highly closedなリファレンスゲノムが利用可能であれば、このゲノムに対してリー…

2018-06-13

SPAdesアセンブラ

Pacbio Nanopore long read assembly bacteria error correction k-mer repetitive sequences DNA解析ソフト hybrid assembly

2018 タイトル修正、tips追加 2019 tweet追加、誤字修正ンストールバージョン3.13.1に更新、spades3.14に修正 2020 インストール追記、リンク追加、新しい論文引用、ツイート追記 2021 1/14 3.15にhelpを更新、ツイート追記、6/10 更新 2022/08/08 インスト…

2018-06-10

ターゲット遺伝子座のリファレンスガイドアセンブリを行う aTRAM2.0

assembly target gene reconstruction k-mer 2015 BMC Bioinformatics 2018

2021 7/21 タイトル修正大規模なシーケンスからの迅速な標的遺伝子座特異的なアセンブリは、現在、医学から広範囲の系統学までの応用分野で、生物学科学全体で一般的に使用されている。ターゲットアセンブリ手法は、完全なゲノムのデノボアセンブリと比較…

2018-06-10

メタゲノムのgene-targeted assembler: MegaGTA

assembly metagenome target gene reconstruction k-mer sequence clustering 2017 BMC Bioinformatics

次世代シーケンシングは、近年のメタゲノミクスの研究を大きく促進してきた。これらの研究は、しばしば何百万から数十億のリードをde novoでアセンブリし、コンティグにして遺伝子アノテーションすることを含む。これは、メタゲノムのアセンブリ効率を大幅に…

2018-06-10

高速かつメモリ使用量の少ないメタゲノムアセンブリツール MEGAHIT

assembly metagenome 高速なツール k-mer 2016 Methods (Journal) mix-assembly

2019 5/6 インストール方法修正、5/7 パラメータ追記、5/15 タイトル修正、5/19 リンク追加、5/17 タイトル再修正、パラメータ修正、6/3 コメント追加、7/27 condaインストール追記 2021 5/7 helpとインストール手順更新、7/21 リンク追加 2022 2/19 メモ追…

2018-06-03

メタゲノムデータをサブサンプリングして繰り返しアセンブリする Spherical

metagenome k-mer assembly 2018 BMC Bioinformatics

過去10年間、研究者らは、ハイスループットシーケンシングを利用して、世界中の多様な環境からの微生物群集の構造と機能を調べてきた[論文より ref.1、2、3]。これらの研究は、微生物の働きについてユニークで斬新な洞察を提供してきたが、入手可能なツール…

2018-06-02

関心のあるバクテリアゲノムのシグネチャを迅速に検出する Neptune

ゲノム比較 (comparative genomics) k-mer bacteria 系統解析

安価かつ迅速に大量のシーケンスを生成する能力は、生物、特にバクテリアのような比較的小さなゲノムを有する生物全体のゲノムを研究する能力を可能にした。計算生物学者は、歴史的に、少数のバクテリアゲノムを比較し、ヌクレオチド、遺伝子およびゲノムス…

2018-05-28

NGSデータからプラスミドを検出するplasmidseeker

plasmid k-mer 2018 PeerJ

2019 2/26 誤字修正プラスミドは、自律的複製および接合が可能な環状または線状の二本鎖DNA分子である。プラスミドは生命の３界すべてに記述されている（Antipov et al、2016）。細菌プラスミドは、ヒトに有毒な多剤耐性細菌の急速な増加に寄与しているホス…

2018-05-25

Y染色体由来リードをエンリッチする RecoverY

fasta/fastqの操作 human genome k-mer haplotype filtering

ハプロイド哺乳動物Y染色体配列は、大規模な次世代配列決定（NGS）プロジェクトではいくつかの理由により適切に組み立てられないことが多い。 Yは女性には存在せず、男性に1コピーのみ存在する。したがって、所望のシーケンスデプスを得るためには、2倍シー…

2018-05-15

k-merを使いアライメントフリーでバリアントをコールする kestrel

bacteria SNV small indel k-mer haplotype

アライメントツールはエラーやバラツキを処理するように設計されているが、リファレンスとは大幅に異なるシーケンスリードを確実に正しい場所に割り当てることはできない。アラインメントの信頼性が低いと、バリアントコールの信頼性が低くなり、真のバリア…

2018-05-09

MinHashを使いfasta / fastqから生物種を高速推定する BBSketch

ANI 生物種の推定 (taxonomic profiling) Nanopore long read Pacbio k-mer 高速なツール MInHash fungi rRNA protein search

2019 6/13 追記 2019 7/18 インストール追記 2020 7/7 コマンド追記、help 更新 2020 7/9 文章追記以前このブログで紹介したBBtoolsに、Minhashアルゴリズム（リンク）を使ってわずか数秒でゲノムなどの大きな配列を比較し、トップヒットを返してくれる機能…

2018-05-05

小メモリで高速にメタゲノムのtaxonomy assignmentを行う metaOthello

metagenome k-mer 生物種の推定 (taxonomic profiling) 系統解析高速なツール taxonomic assignment 2018 Bioinformatics abundance estimation in metagenomics data

2018 10/7 タイトル修正 Metagenomicsとは、興味ある環境から得られたゲノム研究であり、例えばヒトの体内（Huttenhower and Human Microbiome Project Consortium、2012）、海水（Venter et al。、2004）、酸性雨排水（Tyson et al 、2004）などが例として…

2018-05-01

K-mer分析ツール KAT

k-mer ゲノム比較 (comparative genomics) assembly quality check evaluation tool duplication repetitive sequences 2017 Bioinformatics 結果の視覚化 (visualization) metagenome GC

2019 5/15 リンク、condaインストール追加 2019 5/16 タイトル修正 2020 9/27 help更新ハイスループットの全ゲノムショットガン（WGS）データセットの迅速な解析は、大きなサイズが生み出す複雑さのためにチャレンジングである（Schatz et al、2012）。 WGS…