macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Serotypeを予測するSerotypeFinder

 

 大腸菌(Escherichia coli)は通常無害な共生菌であるが、特定の病原性メカニズムによってヒトおよび/または動物に病気を引き起こす能力を発達させた種もある。場合によっては、感染は致死的であり得る(論文より ref.1)。Serotyping( wiki)(以後、血清型検査)は、1940年代以来発達して以来、標準化された手順(2-4)に発展してきた大腸菌の分類法である。血清型検査の実施には、高いレベルの専門知識と抗血清へのアクセスが必要となる。それは時間がかかり、面倒な手続きである。

 O:K:H血清型は、リポ多糖(LPS)(O抗原)、莢膜抗原(K)、および鞭毛(H)抗原の3つの免疫原性構造の組み合わせに基づく。
 ほとんどの研究所はKタイピングを行うことができないので、O:H血清型は病原性大腸菌の特徴付けのゴールドスタンダードとなっている。 O:H血清型検査は、アウトブレイクの検出、疫学サーベイランス、大腸菌分類学的な差異、種内の病原性血清型の検出、クローンおよび進化学の研究において極めて重要である。パルスフィールドゲル電気泳動(PFGE)、リボタイピング、および multilocus sequence typing(MLST)のような最近開発されたいくつかの分子タイピング方法とは対照的に、血清型分類は抗原応答に直接関連する情報を提供し、分離株の生態学にとって重要である。現在のところ、このタイピング方法は他の方法に置き換えることはできない。
 現在の血清型分類法は、01から0188まで命名された188個のO群からなり(O182〜O188の公開が保留中)、O群O31、O47、O67、O72、O94およびO122がスキームから取り除かれている(ref.3,5)。  H13、H22、およびH50を除いて、H1〜H56と命名されたスキームには、53種のH抗原が含まれている(ref.5,6)。

 リポポリサッカライド(LPS)は、外膜に包埋され、脂質A、コアオリゴ糖、およびO抗原と呼ばれるO-特異的多糖鎖の3つの成分からなる。 O抗原は、通常、広範囲の糖に由来する2〜7個の糖残基を含むオリゴ糖(O単位)の10〜25の反復単位からなり、細菌細胞の最も可変な領域である。大部分のOユニットは膜を横切ってトランスフェクションされ、wzx(O-抗原flippase)およびwzy(O-抗原polymerase)によってコードされるO-抗原プロセシングタンパク質によって重合される。このtranslocationは、Wzx / Wzy依存性経路と呼ばれる。グループ1および4に属する酸性莢膜K抗原はまた、translocationにWzx / Wzy依存性経路を使用し、O群O8、O9、O20またはO101の中性LPS結合ポリマーの1つとしばしば共発現する(ref.7)。これらの中性LPS結合O基が存在しない場合、グループ1および4K抗原にはO指定が与えられ、 K87はO32、K85はO141、K9はO104である。転座がwzmによってコードされるトランスポータータンパク質およびwztによってコードされるATP結合成分によって促進されるO群O8、O9、O52およびO99について、O抗原のtranslocationに関与する別のABC輸送体経路が記載されている(ref.9)。
(2段落省略)
 以前、全ゲノムシーケンシング(WGS)データから大腸菌病原性遺伝子を検出するためのツールVirulenceFinderを提示し、ベロ毒素産生大腸菌(VTEC)の現在のルーチンタイピングの優れた代替物として、迅速かつ匹敵するタイピング結果を提供した(ref.18)。ここでは、O抗原プロセッシング遺伝子wzx、wzy、wzm、およびwzmに基づいて、WGSデータからの大腸菌の血清型予測のために構築された、publicに利用可能なゲノム疫学(CGE)ウェブツールのSerotypeFinderを紹介する。SerotypeFinderで得られた結果と従来の血清型で得られた結果との比較から、従来の血清型よりもはるかに迅速かつコスト効率よく実施できるWGSベースのタイピングの優位性が示された。

 

マニュアル

https://cge.cbs.dtu.dk/services/SerotypeFinder/instructions.php

 

ラン

https://cge.cbs.dtu.dk/services/SerotypeFinder/

E.coliのみ利用できる。

f:id:kazumaxneo:20180703215114j:plain

アセンブリして得たcontigのFASTAファイルをアップロードする。 fastqは使用できない。Center for Genomic Epidemiologyの他のツールと同様、混雑時はジョブ開始まで時間がかかる。

 

出力

https://cge.cbs.dtu.dk/services/SerotypeFinder/output.php

f:id:kazumaxneo:20180703215304j:plain

Serotypeは真ん中に出力されている(b)。またその遺伝子と関連情報が表示される。各データはテキスト形式でダウンロードできる。

 

引用

Rapid and Easy In Silico Serotyping of Escherichia coli Isolates by Use of Whole-Genome Sequencing Data
Joensen KG, Tetzschner AM, Iguchi A, Aarestrup FM, Scheutz F
 J Clin Microbiol. 2015 Aug;53(8):2410-26.