macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ANItoolsをwebで実行できるANItools web

 

 単離されたバクテリア株の迅速かつ正確な分類は、医療微生物学、特に全国的または全世界的な広がりの脅威を伴う感染症発症中の最も重要な課題である(論文より ref.1)。しかし、現在の分類方法はすべて、表現型の類似性や化学的性質に基づく方法のみならず、フラグメントのヌクレオチド配列(16Sおよびマルチシーケンス配列タイピング[MLST])に基づく現代の遺伝的方法も解像度の点で欠点を有する(ref.3-5)。closely relatedな種(97%以上の類似性)を区別するためには、16S rRNAの分子構造は保存され過ぎている(ref.6-8)。さらに、原核生物の早期分類は、表現型の類似性および化学的特性のみに基づいており、温度およびpHなどの環境因子によってある程度影響され、偏りの可能性がある(ref.4)。 16S rRNAおよびMLST法を用いた分類はまた、1つ以上のシーケンシングエラーによってバイアスがかかる可能性がある。

 最近では、任意の2つの株の間で共有される全ての配列のペアワイズ比較から計算された平均ヌクレオチド同一性(ANI)が、細菌種の定義および分類のための新しい測定基準として提案されている。 2005年には、Pro. Konstantinidisは最初に70の関連した種を評価し、2種間の共通遺伝子のANIが株間の遺伝的関連性を比較するための堅牢な手段であることを見出した。 〜94%のANI値は、現在の種定義(ref.9-11)の従来の70%のDNA-DNA再会合(ハイブリダイゼーション)基準に対応することが示された。 2012年にはさらに、ChanがテストケースとしてAcinetobacter属の38株を用いて、ANI結果がコアゲノム系統学および伝統的なアプローチと合致し、既存の分類学(ref.12)と適合することを証明した。著者らの以前の研究(ref.2)では、1226菌株における2つのゲノム比較の正確なANI値を計算し、列挙した。これは、ANIに基づく種の分類がNCBIバクテリア分類学と優れた一致を示すことを示している。この研究は、ANIがバクテリア分類学のために有用であることを証明し、既存および新規のバクテリア種の定義のための強力な候補方法を表している(ref.2)。

 他の方法と比較して、2つの株間の全ゲノム比較に基づくANI分析は、より高い解像度を有し、配列選択およびエラーによって引き起こされるバイアスを回避することができる。 2つのclosely relatedなバクテリア種であっても、ゲノムレベルでのDNA発散に基づいて区別することができ、シーケンシングリードのカバレッジの助けを借りて、1つまたは少数のシーケンシングエラーを容易に調整することができる(ref.2)。 ANItoolsに加えて、ANI 値計算には他のプログラムも用意されている (JSpecies) (ref.6,13)。しかし、以前のバージョンのANItoolsを使用するには、パラメータ調整に加えて、パーソナルコンピュータ上のいくつかの追加プログラム(BLASTやHmmerなど)のインストールと同様にインストールが必要である。さらに、何千ものバクテリアゲノムのために現在ANIデータベースを一般に公開することはできない。 JSpeciesWS(ref.13)はいくつかのバクテリア株間のANI値を計算するためのWebバージョンもサポートしているが、系統数制限(最大15ゲノム)は属または種レベルでANIマトリックスを得る可能性を妨げ、また、同じ属または種の系統間の関係を図式的に示すこともできない。 ANItoolsの他に、JSpecies(ref.6,13)という別のANI値計算プログラムがある。しかし、両方のツールは期待どおり完璧ではない。 ANTIoolsは、BLASTやHmmerなどの特定のAdd-Inプログラムも、その間に常に関連するパラメータの設定や調整作業を伴い、パーソナルコンピュータまたはサーバーにローカルにインストールする必要がある。それは、ITやバイオインフォマティクスについての背景がないユーザーにとってあまり親切ではないことを意味する。 JSpeciesWS(ref.13)に関して、最初のツールはANIを計算するためにオンラインで使用でき、パラメータのセットアップや調整作業を一切必要としない。しかしキャパシティ制限(最大15)のために、ユーザは属または種レベルでANIマトリックスを得る機会がなく、その間に多すぎる菌株を分析する必要がある。さらに、同じ属または種の系統間の関係を図式的に示す系統樹の結果は存在しない。

 そのため、上記の結論に沿って現在のツールのすべての欠点を解消するために、最終的に、ANItools 2.0(http://ani.mypathogen.cn/)のWebバージョンをプログラミングした。 ANItools Webバージョンは、ユーザーがオンラインでANI値を直接取得するのに役立ち、以前のLinuxバージョンと比較して調べられたゲノムの数を増加させる。このデータベースに含まれている (2773 strains, 1487 species and 668 genera)任意の2つの系統のANI値が比較できる 。 ANItools webは細菌株の関係を定義するのに有用であり、ゲノムデータを使用するバクテリア種の分類と同定に役立つ。現在利用可能なソフトウェアと比較して、ANItools Webはユーザーの関与を最小限に抑えている。必要なのはゲノム配列のアップロードと属データの選択のみである。入力ゲノムとデータベースのゲノム配列間の比較を自動的に実行し、ANI計算結果のグラフレポートを生成する。

 

ヘルプ

http://ani.mypathogen.cn/docs/ANItools_Help.pdf

 

使い方

ANItools webにアクセスする。

http://ani.mypathogen.cn

f:id:kazumaxneo:20180910200035p:plain

 

 

調べたいバクテリアゲノムのfastaをアップロードする。例えばE.coli O157-H7のゲノムfastaをアップロードしてみる。

f:id:kazumaxneo:20180910200141p:plain

Browseからローカルのファイルを選択し、Uploadをクリック。

 

データベースの比較したいバクテリアの属などを選択する。 

f:id:kazumaxneo:20180910200412p:plain

 

準備ができたらランする。

f:id:kazumaxneo:20180910200545p:plain

 

しばらく待つとジョブが開始される。

f:id:kazumaxneo:20180910200617p:plain

 

ANI計算結果

f:id:kazumaxneo:20180910213630p:plain

f:id:kazumaxneo:20180910213627p:plain

 

引用
ANItools web: a web tool for fast genome comparison within multiple bacterial strains
Na Han, Yujun Qiang, Wen Zhang

Database (Oxford). 2016; 2016: baw084.

 

Whole-genome sequence comparison as a method for improving bacterial species definition
Zhang W, Du P, Zheng H, Yu W, Wan L, Chen C. 

J Gen Appl Microbiol. 2014;60(2):75-8.

 

参考資料

http://www.wfcc.info/iccc12/presentations/kkonstantinidis.pdf