macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Microbial Genomics

バクテリアゲノムとプラスミド配列のアノテーションを行うBaktaのwebバージョン

以前このブログで細菌ゲノム配列およびプラスミド配列のアノテーションを行うBaktaというツールを紹介しました(リンク)。BaktaはFAIRの原則に従った標準アノテーションを高速に実行でき、アノテーション結果をNCBIやENAに直接登録できる(レポジトリ参照)…

遺伝子構造に基づいてメタゲノム中の真核生物と原核生物のコンティグを区別する Whokaryote

2022/05/04 追記 メタゲノミクスは、微生物群集に含まれるすべての生物の機能的可能性を研究するための著名な技術となっている。しかし、ほとんどの研究では、真核微生物を無視して、微生物群集に含まれるバクテリアに焦点を当てている。実際、多くのメタゲ…

ドラフトアセンブリからプラスミドを同定する MOB-suite

コストパフォーマンスの高いIllumina社のショートリードシーケンシングにより、大規模な細菌集団遺伝学研究が日常的に行われるようになった。しかし、プラスミドのアセンブリが不完全であるため、プラスミドの含有量を分析することは依然として困難である。…

バクテリアのゲノムやプラスミドのアノテーションを行う Bakta

2021 5/18 ツイート追加 2021 11/11 論文引用 2022/03/10 help更新2023/10/16 インストール手順修正(python3 => python 3.10) Baktaは、バクテリアのゲノムやプラスミドのローカルなアノテーションを迅速かつ標準化するためのツールである。dbxref-richやs…

ユーザーが関心のある遺伝子の周辺配列の相同性を調べる Flanker

2021 3/1 renameコマンド修正 2022/03/17 論文引用 関心のある遺伝子の周囲の配列を解析することは、特に抗菌薬耐性遺伝子などの水平遺伝子導入におけるmobile genetic elements (MGEs) の役割を理解する上で非常に重要であることが多い。ここでは、一貫した…

ユーザー提供のゲノムfastaからwgMLSTおよびcgMLST解析 を行う chewBBACA

細菌ゲノム疫学やアウトブレイク検出において、遺伝子ごとのアプローチがますます普及してきている。しかし、これらの方法論のためのスキーマ定義や対立遺伝子呼び出しのためのオープンソースのスケーラブルなソフトウェアが不足している。chewBBACAスイート…

パンゲノムにおいて有意な関連性の遺伝子を検出する Coinfinder

原核生物および真核生物のパンゲノムのアクセサリー遺伝子は、遺伝子水平伝播、loss of gene、および選択の影響により蓄積する。 Coinfinderは、パンゲノム内の相同な遺伝子(遺伝子ファミリー)のセットが偶然に予想されるよりも頻繁に相互に関連または解離…

バクテリアゲノムの進化をシミュレートする SimBac

バクテリア全ゲノムシーケンシングは急速に普及しており、高解像度の遺伝情報を迅速かつ費用対効果の高い方法で提供することにより、multilocus sequence typing(MLST)に取って代わっている(Didelot et al、2012; Wilson、2012)。遺伝学的データを使用し…

E.coliとKlebsiellaに対応したWGSからのプラスミド検出ツール PlaScope

最近、いくつかの研究がin silicoプラスミド予測ツールの有効性を評価している[ref.1、2]。実際、現在、多くのバイオインフォマティクス法が、リードカバレッジ解析(例:PlasmidSPAdes)、k-merベースの分類(例:cBAR、PlasFlow)、レプリコン検出(例:Pl…

IRLとIRRに挟まれたトランスポゾンのab initio挿入を 高感度に検出する panISa

20210910 誤字修正 2021 12/27 追記 2022 1/4 インストール手順変更 panISaソフトウェアは、ショートリードデータから、最初に(すなわち、データベースを含まないアプローチで)NGSデータ上の挿入配列を検索する。 手短に言えば、ソフトウェアは、潜在的なI…

rRNAを使ってバクテリアのゲノム構造を調べる Socru

2020 2/1 ツイートリンク追加 2020 7/2 論文追記 バクテリアゲノムは構造的リアレンジメントを受けることができるダイナミックな実体(entities)である。これらのリアレンジメントは、リボソームrRNAオペロンおよびファージを含むリピート配列周辺で相同組…

multi-FASTA alignmentからSNPを抽出する SNP-sites

次世代シーケンシング(NGS)技術は、 Single Nucleotide polymorphism(SNP)発見のためにゲノムを大規模にリシーケンシングすることを容易にした。そのようなプロジェクト中に発見された何千ものSNPは、生物学的解釈および計算解析のためにいくらかの困難…

変異の自動解析パイプライン NASP

バクテリア、ウイルス、真菌および寄生生物を含む微生物からの全ゲノムシーケンシング(WGS)データはpublicデータベースで急速に増加しており、アウトブレイク調査(Rasko et a、2011; Eppinger et al、2011; Engelthaler et al、2016)、系統学と血清学を…