macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

plasmid

抗生物質耐性遺伝子や病原性遺伝子を素早く検索できる ABRicate

ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。webツールは混雑していると実行するまで何時間も待たされることがあるが、本ツールはコマンドラインで実行し、素早く結果を得…

腸内細菌科(エンテロバクター科)のプラスミド同定ツール PlasmidFinder

プラスミドは、自律複製が可能であり、異なるバクテリア種とクローンとの間で移動可能な二本鎖の環状または線状DNA分子である。既知のプラスミドのほとんどは、抗生物質耐性または病原性遺伝子のようなバクテリア宿主上で陽性選択される表現型を付与するため…

NGSデータからプラスミドを検出するplasmidseeker

プラスミドは、自律的複製および接合が可能な環状または線状の二本鎖DNA分子である。プラスミドは生命の3界すべてに記述されている(Antipov et al、2016)。細菌プラスミドは、ヒトに有毒な多剤耐性細菌の急速な増加に寄与しているホストへの有益な特性を…

MinHashを使い高速にゲノムを比較する MASH

BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超えるシーケンス生成が可能である[ref.3]。この規模のデータを管…

メタゲノムのtaxonomyアノテーションを行い定量する MGmapper

迅速で効率的なDNAシーケンシング技術の進歩により、堆積物[論文より ref.1] [ref.2]、水[ref.3]、氷[ref.4]、ヒトなど様々な環境から微生物群集を研究することが可能になった[ ref.6]。既知のDNA配列決定プラットフォームの中で、イルミナHiSeqおよびMiSeq…

ロングリードを使い環状DNAかどうか調べる Circlator

デノボアセンブリの課題は、世界初の自動DNAシーケンサーの登場以来ずっと存在していた。初期ゲノムシーケンスデータのアセンブリは、大きく2つの戦略に基づいていた:BAC / YACタイリングまたは全ゲノムショットガン[論文より ref.1]。これらのストラテジー…

cBarでプラスミド配列を区別する

cBarは(論文発表当時では)大規模なトレーニングデータを用いて学習されたメタゲノムなどのデータ(FASTA)中の プラスミドゲノムを区別する方法論。5量体頻度(pentamer frequencies)を元に判定を行う。入力はFASTAは配列。 インストール macOSXではビル…

ccontigsで環状ゲノムを探す

ccontigsはコンティグ末端の配列がオーバーラップしているかどうか調べることで、コンティグからclosed circularなゲノムを探すツール。環状のプラスミドやウィルスを検出できるとされる。論文にはなっていない。 ただし直鎖状コンティグでも末端が重複して…

アセンブルのgraphからプラスミドデータを検出するツール Recycler

Recyclerはアセンブルのgraph pathからプラスミドの配列を検出する方法論。プラスミドのグラフは他のゲノムのグラフと独立しており、カバレッジが均一な少数のノードで構成される環状のグラフと推測される。これらの手がかりからプラスミドのグラフを探索す…