macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

plasmid

E.coliとKlebsiellaに対応したWGSからのプラスミド検出ツール PlaScope

最近、いくつかの研究がin silicoプラスミド予測ツールの有効性を評価している[ref.1、2]。実際、現在、多くのバイオインフォマティクス法が、リードカバレッジ解析(例:PlasmidSPAdes)、k-merベースの分類(例:cBAR、PlasFlow)、レプリコン検出(例:Pl…

サンプルのコンタミネーションを見積もる Mash Screen

2019 11/5 論文追加 シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さ…

ナノポアのrawロングリードからプラスミドを探索する tiptoft

2019 12/13 タイトル修正 急速にコストが下がる中、Pacific Biosciences(PacBio)およびOxford Nanopore Technologies(ONT)のロングリードDNAシークエンシング技術がアウトブレイク調査に使用され始めている(Faria et al、2017; J. Quick et al、2005 20…

スモールゲノムを可視化したり、複数ゲノムを比較して似た領域、異なる領域を可視化できる Gview

グラフィックなゲノムマップは、ゲノムの特徴および配列の特徴を評価するために広く使用されている。 CGView(Circular Genome Viewer)ソフトウェアファミリーは、バクテリア、オルガネラ、ウイルスのゲノムマップを生成するためのツールの人気のあるコレク…

nrなどのNCBIデータベースをダウンロードする ncbi-blast-dbs

2018 12/10 タイトル訂正 2020 9/7追記2020 9/11 わかりにくい説明を修正、9/11 簡単な並列処理例追記、9/12.9/15 taxonkit コマンド修正, わかりにくい部分を修正、10/3 taxonkitのコマンドを修正、10/10 コマンド微修正、10/28 誤字修正 2022 1/6 例のパラ…

バクテリア間で保存されたシンテシーブロックを探す CSBFinder

2020 7/23 論文追記 ゲノミクス(ゲノム学、ゲノム科学)における重要な問題は、遺伝子がゲノム内でどのように構成されているか、どのような情報がコードされているかである(Rogozin et al、2004)。遺伝子の順序に対する選択圧がない場合、リアレンジメン…

抗生物質耐性遺伝子や病原性遺伝子を素早く検索する ABRicate

2019 3/1 コマンド及びランの流れ更新 2019 3/3 リンク修正 2019 3/14 condaインストール追記 2019 4/12 dockerリンク追加 2019 9/27 コメント追加 2020 4/25 追記 ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子…

腸内細菌科(エンテロバクター科)のプラスミド同定ツール PlasmidFinder

プラスミドは、自律複製が可能であり、異なるバクテリア種とクローンとの間で移動可能な二本鎖の環状または線状DNA分子である。既知のプラスミドのほとんどは、抗生物質耐性または病原性遺伝子のようなバクテリア宿主上で陽性選択される表現型を付与するため…

NGSデータからプラスミドを検出するplasmidseeker

2019 2/26 誤字修正 プラスミドは、自律的複製および接合が可能な環状または線状の二本鎖DNA分子である。プラスミドは生命の3界すべてに記述されている(Antipov et al、2016)。細菌プラスミドは、ヒトに有毒な多剤耐性細菌の急速な増加に寄与しているホス…

MinHashを使い高速にゲノムを比較する MASH

2019 4/12 dockerリンク追加 2021 3/25 condaインストール追記 BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超…

メタゲノムのtaxonomyアノテーションを行い定量する MGmapper

迅速で効率的なDNAシーケンシング技術の進歩により、堆積物[論文より ref.1] [ref.2]、水[ref.3]、氷[ref.4]、ヒトなど様々な環境から微生物群集を研究することが可能になった[ ref.6]。既知のDNA配列決定プラットフォームの中で、イルミナHiSeqおよびMiSeq…

ロングリードを使い環状DNAかどうか調べる Circlator

2019 2/26 condaインストール追記 デノボアセンブリの課題は、世界初の自動DNAシーケンサーの登場以来ずっと存在していた。初期ゲノムシーケンスデータのアセンブリは、大きく2つの戦略に基づいていた:BAC / YACタイリングまたは全ゲノムショットガン[論文…

プラスミド配列を予測する cBar

cBarは(論文発表当時では)大規模なトレーニングデータを用いて学習されたメタゲノムなどのデータ(FASTA)中の プラスミドゲノムを区別する方法論。5量体頻度(pentamer frequencies)を元に判定を行う。入力はFASTAは配列。 インストール macOSXではビル…

環状ゲノムを探す ccontigs

ccontigsはコンティグ末端の配列がオーバーラップしているかどうか調べることで、コンティグからclosed circularなゲノムを探すツール。環状のプラスミドやウィルスを検出できるとされる。論文にはなっていない。 ただし直鎖状コンティグでも末端が重複して…

アセンブルのgraphからプラスミドデータを検出するツール Recycler

2018 1/9 condaインストール追記 Recyclerはアセンブルのgraph pathからプラスミドの配列を検出する方法論。プラスミドのグラフは他のゲノムのグラフと独立しており、カバレッジが均一な少数のノードで構成される環状のグラフと推測される。これらの手がかり…