macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

bacteria

病原性細菌の比較トランスクリプトームおよび共発現データベース bacteria.guru

細菌は単細胞の原核生物であり、相互作用から寄生まで様々な共生関係を築くことができる。細菌の病原性に対抗するためには、遺伝子の機能と制御に関する理解を深めることが必要であり、それが新しい抗菌薬の開発につながる。 Gene expressionは遺伝子の機能…

原核生物のトランスポゾンデータベースとトランスポゾン解析のためのウェブポータル TnCentral

原核生物のトランスポゾンエレメント(TE)のウェブリソースであるTnCentral(https://tncentral.proteininformationresource.org/)の構造と組織について説明する。TnCentralには、Tn3、Tn7、Tn402、Tn554ファミリーのトランスポゾン、複合トランスポゾン、…

バクテリアWGSからバリアントコールと系統解析を行う自動化されたパイプライン bactmap

Githubより nf-core/bactmapは、細菌のWGSから得られたショートリードを参照配列にマッピングし、フィルタリングされたVCFファイルを作成し、VCFファイル内の高品質な位置に基づいてシュードゲノムを作成し、オプションとしてシュードゲノムのアラインメント…

原核生物のゲノムに存在するISエレメントを高感度に検出する digIS

ISエレメントは、原核生物のゲノムの中で最も小さく、最も多く存在する mobile elementsである。ISエレメントは、ゲノムの構成や進化に重要な役割を果たしていることが示されている。宿主ゲノムにおけるISエレメントの機能をよりよく理解するためには、効果…

原核生物のゲノム構造を利用してリボソーム領域全体をアセンブルする riboSeed

バクテリアのゲノムシーケンスの大部分は、イルミナのショートリードを用いて行われている。しかし、ショートリードだけでは繰り返し領域を解決することが難しいため、クローズドなゲノムを得ることができたのは、シーケンスプロジェクトの約10%に過ぎなかっ…

バクテリアの表現型をゲノムから予測する Traitar

2023/12/07 dockerのコマンド修正 配列決定されたゲノムの数は飛躍的に増加しており、データの生成からゲノムの解釈に至るまでのボトルネックが大きく変化している。形質は、細菌を特徴づけたり区別したりするためによく用いられ、微生物群集組成の原動力と…

ゲノムベースの分類学のための自動化されたハイスループットプラット TYGS

微生物の分類学は、ゲノムベースの計算手法の影響を受けつつある。しかし、このような解析は複雑で、専門家の知識が必要となる場合がある。TYGS(Type (Strain) Genome Server)は、ゲノムベースの原核生物分類学のためのユーザーフレンドリーなハイスループ…

マニュアルキュレーションされたシアノバクテリアのデータベース CyanoType

ここで紹介するデータセットは、CyanoType(http://lege.ciimar.up.pt/cyanotype)と名付けられた、関連するシアノバクテリア株のオンラインデータベースの基礎となるものである。このデータベースは、分類学的、系統学的、あるいはゲノム学的に有用なシアノ…

細菌の代謝パスウェイを予測し、正確な代謝モデルを再構築するための情報を提供する gapseq

微生物のゲノムスケールの代謝モデルは、生物の遺伝子型から表現型を予測するための強力なフレームワークである。しかし、手動での再構築は手間がかかる一方で、自動再構築では既知の代謝プロセスを再現できないことがよくある。gapseqは、精査された反応デ…

MetaRon

細菌の遺伝子は環境刺激に反応して効率的に制御され、オペロンとして知られるユニークな遺伝子クラスターを形成している。このように、オペロンの参照情報や機能情報が不足しているため、オペロンの予測は困難である。 本研究では、MetaRon(Metagenome and w…

ハイブリッドアセンブリとビニング及び下流解析を行う自動化されたパイプライン MUFFIN

2021 2/5,2/6 出力例追記 2021 2/11 論文引用 メタゲノミクスは微生物学の多くの分野を再定義した。しかし、メタゲノムアセンブルゲノム(MAG)は、主にショートリードでシーケンスが行われた場合、断片化されていることが多い。最近のロングリードシーケン…

(バクテリア)共存在する遺伝子を探索するwebサービス PhyloCorrelate

系統プロファイリング」として知られるゲノム間のco-occurring genesを統計的に検出する方法は、遺伝子間の機能的関連を推測するための強力なバイオインフォマティクス技術である。系統樹データベースのサイズと複雑さ、系統樹構造の考慮の難しさ、ゲノムア…

原核生物のゲノムアセンブリでキメラや汚染を調べる GUNC

2021 1/18 解析例追加 2021 6/15 論文引用 2022/06/16 コマンド更新、10/13 追記 ゲノムは原核生物の系統の遺伝的青写真であり、現在進行中の微生物世界のセンサスの中心にある微生物学の基本単位であり、微生物の生態と進化の研究に不可欠なものである。199…

(主に微生物)代謝モデルのデータベース BiGG Models

BMC Bioinformatics. 2010 Apr 29;11:213 COBRA(Constraint Based Reconstruction and Analysis)フレームワークに基づくゲノムスケールの代謝再構成は、生物の代謝能力を解析し、実験データを解釈するための貴重なツールである。このような再構成や解析手…

prokaryotesの自動化されたRNA seq解析パイプライン prokseq

2021 1/8 誤字修正 大規模な並列シーケンシングの進歩とシーケンシングコストの劇的な削減により、RNAのディープシーケンシング(RNA-Seq)はRNA転写産物の同定と定量化のための主要なツールとなった。今日、RNA-Seqは、創薬標的の同定、新規遺伝子制御機構…

ターゲットの菌株の種類と豊富さを調べる mixtureS

環境試料中の細菌株を研究することは不可欠である。既存の方法やツールは、既知の菌株や変異株に依存していることが多く、個々のサンプルに対応できない、信頼性が低い、使い勝手が悪いなどの問題がある。そのため、より正確に菌株を同定できる、より使いや…

NCBIのデータベースへのリモート検索によって保存された遺伝子クラスターを探索し、クラスタリングして視覚化する cblaster

2020 11/11 extractコマンド追記 2022/11/21 登録コマンド追記 代謝、薬剤耐性、病原性などの生物学的パスウェイに関与する遺伝子は、多くの場合、遺伝子クラスターとしてクラスター化されている。相同な遺伝子クラスターを特定することは、その機能や進化の…

バクテリアの遺伝子配列を比較する LS-BSR

2021 1/18 わかりにくい説明を修正 細菌単離株からの全ゲノム配列データが安価に入手できるようになるにつれ、配列データと生物学的観察結果を相関させる計算手法が必要とされている。ここでは、数百から数千の細菌ゲノムの遺伝的内容を迅速に比較し、調査し…

バクテリアの高精度なアセンブリツール Platanus_B

2020 11/6 誤字修正 ショート DNA リードのデノボアセンブリは、特に大規模プロジェクトや疫学における高解像度の変異解析に不可欠な技術であり続けている。しかし、既存のツールでは、近縁の菌株を比較するのに必要な十分な精度が得られないことが多い。こ…

NCBI Genome のBrowse by Organism機能

2020 10/25 追記 ハイスループットシークエンシング技術の普及により、NCBIなどの塩基配列データベースに登録されるゲノム数は爆発的に増大している。BLAST検索をやり直したら少し前は無かったゲノム情報が出てきた、という話も度々耳にする。特にバクテリア…

ラージデータセットのコアゲノムを高速に構築する CoreCruncher

コアゲノムとは、原核生物のある集団や種のすべての、あるいはほぼすべての系統が共有する遺伝子の集合を意味する。コアゲノムを推定することは多くのゲノム解析に不可欠だが、ほとんどの手法はすべてのゲノムのペアを比較することに依存している。ここでは…

微生物ゲノムの包括的なアノテーションを行う MicrobeAnnotator

2020 9/5 修正 2020 9/7 誤字修正、出力追記、 2023/07/04 論文引用 ハイスループットシーケンシングにより、利用可能な単離株、シングルセル、メタゲノムからの微生物ゲノムの数が増加している。これらのゲノムを解析・比較するためには、高速で包括的なア…

バクテリアとアーキアの正式名称やタイプストレイン情報などを掲載するデータベース LPSN

2020 9/3、9/6 誤字修正 1997年の論文 このリストには、International Journal of Systematic Bacteriologyに掲載された細菌の正式名称がアルファベット順に年代順に掲載されている。5,569種(1996年12月31日現在)を網羅しており、インターネット上で入手可…

ロングリードシークエンシングから環状プラスミドを同定しARGsなどのアノテーションをつける PlasmIdent

多剤耐性菌の感染は、多くの場合、治療の選択肢が限られているか、あるいは全くないままである。細菌種間での遺伝子の水平移動によるプラスミドの移動は、抗生物質耐性遺伝子(ARG)拡大の重要なモードを表している。ここでは、複数の細菌種内および細菌種間…

バクテリアゲノムからプロファージを予測してアノテーションをつける DBSCAN-SWA

2020 8/21 追記と修正 ファージは、細菌宿主ゲノム中のバクテリオファージの細胞内形態として、通常、高い特異性を持って細菌のDNAに組み込まれ、水平遺伝子導入(HGT)に寄与している。ファージを用いて細菌を死滅させ、病原性細菌感染症や耐性細菌感…

注釈付きで検索可能な微生物のインベントリ The Microbe Directory

次世代シークエンシング技術の出現により、ここ10年で、ヒトのマイクロバイオームから環境(水や土壌)、都市の表面に至るまで、メタゲノムやマイクロバイオーム研究が急増している。これらの研究はすべて、発見された配列をサンプルに見られる分類学的プロ…

自動化されたProkaryotesのRNA seq解析パイプライン ProkSeq

2020 6/29 補足説明追加。 RNA-seq技術は、導入以来、病原性細菌の研究において異なる条件にさらされた細菌からの複数のサンプルにわたる遺伝子発現の違いを同定し、定量化するために広く利用されてきた。一部の例外を除いて、遺伝子発現を評価するための現…

バクテリアとアーキアのアミノ酸生合成パスウェイを調べる GapMind

2021 1/15 ファイルサイズが大きいと受け付けないエラーが修正されたのを確認 ゲノム配列は何万もの微生物について利用可能である。これらの微生物のほとんどについては、分離された条件以外にその生理学についてはほとんど知られていない。また、酵母エキス…

従来型のMLSTタイピングを行う mlst

2020 6/4 コマンド修正 mlstは、ゲノム配列を入力として伝統的な7つの遺伝子座に対するタイピングを行う。PubMLSTのタイピングスキームに従う。 インストール 依存 Perl >= 5.26 NCBI BLAST+ blastn >= 2.9.0 You probably have blastn already installed a…

パンゲノムグラフから微生物の多様性を調べる PPanGGOLiN

2020 4/10 引用追加、タイトル修正 2021 1/4 追記 2023/5/30追記 2024/02/26 追記 機能研究、進化研究、疫学研究のために比較ゲノムを使用するには、与えられた種での発現の観点から遺伝子ファミリーを分類する方法が必要である。これらの方法は、通常、分割…