macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

NGSデータから素早くバクテリアの分析を行う MICRA

 

 

 ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば、新規な抗菌化合物およびワクチンの開発を可能にしている[論文より ref.1]。 HTSはまた、ゲノムベースの診断[ref.2]のための新しい方法を提供し、したがって感染症[ref.3]およびアウトブレイクのフォローアップ[ref.4]の治療のための臨床応用のための新しいアプローチを可能にする。微生物ゲノムを調査するためのスループットの点で十分なパフォーマンスを備えた安価なプラットフォームである第2世代のベンチトップシーケンサーの発売は、微生物学におけるこの革命に貢献しており、第3世代のシーケンサーはこれを加速する。食品医薬品局(FDA)は、感染症診断と抗菌剤耐性および病原性マーカー検出のためのHTS検査の検証のためのコンセプトを開発しており、HTSベース診断のマイルストーンとなっている。しかし、実験室で実施されるためには、技術的側面とバイオインフォマティクス分析の両方に対して、標準化、最適化、および検証アッセイを実施しなければならない。

 膨大な数のツールが利用可能であるが、HTSデータを分析することは、基礎的および臨床的研究にとっては困難なことである。技術とアルゴリズムの絶え間ない進化は、HTS分析のための標準化された手続きの欠如をもたらす[ref.6]。さらに、バイオインフォマティクスがサポートされていないと、完全な分析のためにいくつかのツールを連続して使用する必要がある。たった数個の完全なパイプラインが存在し、それらの大部分は病原体同定のためだけである。 「識別」という用語は、「特徴付け」という用語と区別されなければならない。同定の目的は菌株を決定することであるが、微生物ゲノムの特徴付けは、遺伝子移入または特定の変異を含む遺伝的特徴を強調する深い研究である。微生物ゲノムの特徴付けのための使いやすいインターフェースと判読可能な結果を​​提供する迅速で自動化されたツールは、HTSデータを時間的に完全に活用する上で非常に重要になる。

 この論文では、リードの分析による微生物同定と特性評価のためのMICRAについて説明する。 MICRAの独創性は、デノボアセンブリおよび配列アノテーションの普及した手順に従うのではなく、効率的なリードのマッピング方法と登録された微生物ゲノムを利用する方法にある。シーケンシング深度のバラツキ(バクテリアがプラスミドを含む場合など)は、デノボアセンブリプロセスを困難にし、実行時間を大幅に増加させる可能性がある。 MICRAでは2種類のマッパー、すなわち高速なマッパーと堅牢なマッパーが結合され、効果的かつデータの損失を回避する原核生物に特化した新しいバリエーションコーラーが開発された[ref.7]。 MICRAは、臨床医と生物学者の両方にとって使いやすいように開発されたWebインターフェイスとして自由に利用できる[ref.8]。パラメータは、ユーザーに完全な自動分析を提供するように最適化されており、要求されるのはリード情報のみになる。より専門的な作業のために、MICRAは、多くの設定パラメータへのアクセスを提供し、カスタマイズ可能にする。出力は直接読み取って使用可能である。 MICRAはいくつかの研究で評価された。すべての結果は、MICRAが迅速であり(ほとんどの場合約10分)、基本的な微生物学ならびにcirculating and emerging strainsの研究のための新しい洞察を提供することを示している。

 

fastqをアップデートすると、自動でベストマッチするリファレンスを決定し、バリアントを検出する。いくつかの処理でアンマップのままのリードはアセンブルされ、病原性細菌にフォーカスしたデータベースPATRICに対して相同性検索される。また、抗生物質耐性遺伝子の検索も行われる。全ての処理は数分で終わる。高速なマッパーと精度の高いマッパーを使い分けることで、迅速かつ精度の高い分析が可能になっている。

 

f:id:kazumaxneo:20180407194227j:plain

論文より転載。MICRAのパイプライン。

 

シーケンスデータをアップロードして解析できるwebサーバーが準備されている。

http://www.pegase-biosciences.com/MICRA/micra.php

f:id:kazumaxneo:20180407152922j:plain

ユーザーガイド

http://www.pegase-biosciences.com/MICRA/help.php

 

メールアドレスを記載し、fastqファイルを指定する。gzとzip圧縮にも対応している。ファイルサイズは最大1GB。illuminaのほかion torrentのシーケンスデータにも対応している。

f:id:kazumaxneo:20180407185326j:plain

 

advancedにチェックをつける。チェックをいれると、処理の有無や、パラメータ設定などをユーザーが指定できる。

f:id:kazumaxneo:20180407185415j:plain

 

解析前にQCとクオリティトリミングも行える。

f:id:kazumaxneo:20180407185455j:plain

 

デフォルトではMICRAがベストマッチのリファレンスを検索し、それにマッピングを行うが(詳細はマニュアル参照)、ユーザーがリファレンスを提供することもできる。

f:id:kazumaxneo:20180407190224j:plain

 

General options

f:id:kazumaxneo:20180407190307j:plain

 

Performs Antibiotic moduleにチェックを入れると、抗生物質耐性遺伝子を検索できる。

f:id:kazumaxneo:20180407190429j:plain

Jobをスタートする。早ければ数分で解析終了のメールが届く。

 

解凍したフォルダ。複数フォルダがあるがsummary.htmlがまとめとなる。

f:id:kazumaxneo:20180407192722j:plain

summary.html

 

f:id:kazumaxneo:20180407193208j:plain

Image for the comparative genomics (SVG): 使用されたリファレンスと比べて違いがある遺伝子は、色が変化する。

f:id:kazumaxneo:20180407193351j:plain

 

 

 

そのほかMICRA: Comparison moduleでは、MICRAの出力ファイルを使い複数のゲノムを比較してベン図などを描画できる。

MICRA: comparison module

 

論文で使用されたテストデータもダウンロードできる。

http://www.pegase-biosciences.com/MICRA/data.html

このリンクから、Clinical case: the 2011 German outbreak caused by Escherichia coli O104:H4、の解析結果をダウンロードした。DrugBank matchとARDB matchの抗生物質耐性遺伝子検出結果を開いてみる。

f:id:kazumaxneo:20180407184454j:plain

複数の抗生物質耐性遺伝子が検出された。いわゆる多剤耐性菌と考えられる。

 

 

引用

MICRA: an automatic pipeline for fast characterization of microbial genomes from high-throughput sequencing data

Ségolène Caboche, Gaël Even, Alexandre Loywick, Christophe Audebert and David Hot

Genome Biology201718:233