macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

病原性細菌の同定とタイピングを行うwebツール PathoBacTyper

 

 生物のゲノムDNAは生物学的にfunctionalな遺伝情報を持っている。生物の全ゲノム配列を解読することは、複雑な生物学研究における基本的なタスクである。以前は、完全なバクテリアゲノム配列を解読するために従来のサンガーシーケンシングが使用されていた。しかし、この方法は非常に高価で面倒である。近年、次世代シーケンシング(NGS)技術においてかなりの進歩が見られた。現在、NGS法は、数日以内に100ドル未満の費用でバクテリアゲノムの解読を容易にすることができる。したがって、近い将来には、全ゲノムシーケンシング(WGS)が臨床および公衆衛生研究所で使用され、疾病監視、耐性予測、集団感染検査、およびそれらの間の進化関係の確立のための日常的な診断および遺伝子型決定ツールになると予想される。異なる株(Parkhill et al、2001; Merker et al、2013; Struelens and Brisse、2013; Franz et al、2014; Gordon et al、2014; Halachev et al、2014; Joensen et al、2014; Kose et al、2014; Luo et al、2014; Schmi et al、2014)。その臨床および公衆衛生的用途に加えて、WGSは、ヒト疾患の病因に関する研究のような基礎生物医学研究のための非常に有効な方法である(Acke et al、2014; Hoffmann et al、2014; Meinel et al、2014 )しかしながら、NGSプラットフォームは典型的には何百万ものショートリード配列を生成し、そして遺伝子型および異なる株に対する耐性などの必要な情報を生成するためのそのような多数の短いWGSの分析は困難である。臨床および公衆衛生検査室のほとんどの研究者はバイオインフォマティクスの専門知識を欠いているので、WGSの分析を自動化し、検査室で異なる菌株の遺伝子型比較を行うための簡単で使いやすい分析プラットフォームの開発が必要である。

 全ゲノム規模の一塩基多型(wgSNP)アプローチは、細菌株の遺伝子型決定に適していることが実証されている(Achtman、2008; Nielsen et al、2011; Leekitcharoenphon et al、2014)。多くの研究者が、異なるタイプの病原性細菌の発生を検出するためにwgSNP分析をうまく適用した(Holt et al、2010; Bakker et al、2011; Octavia et al、2015; Taylor et al、2015; Bekal et al、2005, 2016) WGSデータを操作してwgSNPメタデータを生成するために、Lyve-SET(Katz et al、2017)、SNVPhyl(Petkau et al、2016)、およびCFSAN SNP Pipeline(Davis et al、2015)などのいくつかの効果的なツールが設計されている 。しかし、これらのwgSNPツールは通常、コマンドラインプログラムとして展開される。これは、臨床および公衆衛生研究所でWGSデータを操作しなければならないほとんどのウェットラボ従業員にとっては不便で困難である。そのため、最先端のラボ担当者は、さらなるアプリケーションのためにWGSデータからwgSNPメタデータを生成するのに役立つことができる使いやすいツールを強く求めている。

 本論文では、病原菌の同定と400以上の病原菌の分子ジェノタイピングのためのWebサービスツールPathoBacTyperを紹介する。本研究では、Bekal et alによって以前にシーケンシングされた3つのアウトブレイクからの59のSalmonella Heidelberg WGSリードの4つのデータセットを同定および遺伝子型を決定することによってPathoBacTyperの操作を実証した。

 PathoBacTyperは2つの機能を提供する:種の同定と細菌株のタイピング。 種の同定では、ユーザーがアップロードしたWGSリードを478の病原性細菌ゲノムを含む事前作成済みのリファレンスデータセットマッピングする。 次いで、マッピングされたリード量に従って種を同定する。 ユーザがアップロードした単離された全ゲノムシーケンシングリードから種が認識された後、その種の対応するリファレンス配列が以下の株タイピングプロセスのために自動的に選択される。 論文の図1は、PathoBacTyperの全体的なワークフローを示している。(以下略)

 

f:id:kazumaxneo:20190403230700p:plain

The schematic work flow of PathoBacTyper.  論文より転載

 

PathoBacTyperに関するツイート

 

使い方

http://halst.nhri.org.tw/PathoBacTyper/にアクセスする。

f:id:kazumaxneo:20190403204050p:plain

 

WGS fastq(<1GB)、またはassembly.fasta(<10Mb)をアップロードする。

f:id:kazumaxneo:20190403221949j:plain

上ではペアエンドfastqをウィンドウにドラッグ&ドロップした。データはあるだけ入れる。複数のデータを入れないと種の同定以外は意味がなくなる。

 

解析にはしばらく時間がかかる。emailも指定しておくとラン後にメールが届く。

f:id:kazumaxneo:20190404080503p:plain

ページは定期的にリロードされ、解析が終わると結果のページに切り替わる。

 

ここからはexampleデータの結果。exampleデータはSalmonella_entericaのアウトブレイクデータ(60ほど)を同時に解析している。

1、種の同定

f:id:kazumaxneo:20190403231420p:plain

 

SNPプロファイルからMDSプロットとSNP系統樹が自動作成される。使用される方法については論文に記載されている。

f:id:kazumaxneo:20190403231455p:plain

結果は左下のリンクからダウンロードできる。 

 

引用

PathoBacTyper: A Web Server for Pathogenic Bacteria Identification and Molecular Genotyping
Ming-Hsin Tsai, Yen-Yi Liu, Von-Wun Soo

Front Microbiol. 2017; 8: 1474