macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

スタンドアロンのGUI環境で動作する抗生物質耐性遺伝子検索ツール SSTAR

 

 Antimicrobial resistance(AR)は、近年急速に増加する現象であり、世界的な公衆衛生上の重大な脅威である(論文より ref.1,2)。 EnterobacteriaceaeやPseudomonasのような新興のカルバペネム抗生物質耐性バクテリアは、多くの治療法を無効にしているため特に懸念される。カルバペネム耐性の出現は、カルバペネムおよび他のβ-ラクタム系抗生物質を不活性化するタンパク質をコードする獲得性のカルバペネマーゼ遺伝子によって主に媒介される(ref.3)。拡張型β-ラクタマーゼ(ESBL)またはAmpC型β-ラクタマーゼの産生と組み合わせることができる、外膜ポーリンおよび排出メカニズムの改変または喪失を含む他のメカニズムもまた記載されている(ref.4)。 AR遺伝子は、水平遺伝子導入によって獲得でき、またバクテリアクロモソーム遺伝子座におけるspontaneousな突然変異のために生じ得る。新規の対立遺伝子の予測を含むAR決定基の迅速な同定は、AR病原体の分子疫学を理解し、感染制御介入を知らせるために重要であり、これは患者治療の指針として有用であり得る。

 近年、DNAシーケンシングのコストは急速に減少しており、この技術は世界中の大規模なコミュニティに利用可能になっている(ref.5)。アウトブレイク調査、疫学サーベイランス、およびARに関連する遺伝子の検出(ref.6-8)で、全ゲノムシーケンス(WGS)データが株の特徴付けに使用されている。 AR遺伝子を含む多くのオンラインデータベースは、現在一般に公開されている。最も完全で最新の2つのリポジトリは(論文執筆時点)、ResFinder(version3 database)(ref.9)(紹介)とComprehensive Antibiotic Resistance Database(CARD: CARD HP)(ref.10)である。これらのサービスでは、ユーザーはバクテリアゲノム配列をWebサービスにアップロードし、その後取得した抗菌抵抗性遺伝子のリストを取得できる。しかしこれらのWebサービスは比較的遅く、複数のゲノムファイルを照会したいユーザーのハードルになる可能性がある。

 SRST2(ref.11)、ARG-ANNOT(ref.12)、ABRicate (https://github.com/tseemann/ abricate)(紹介)などのオフラインソリューションも存在する。獲得された耐性遺伝子検索に加えて、ARG-ANNOTデータベースは、ARに関連することが知られているクロモソームターゲット遺伝子における点突然変異解析を含む。 SRST2、ARG-ANNOT、およびABRicateはローカルで実行され、ユーザーにWebベースのサービスよりも多くの制御を与える。 SRST2とABRicateはコマンドラインインターフェイスのみを提供し、ARG-ANNOTは古いソフトウェアパッケージ(ref.13)で動作する。 ARG-ANNOTおよびABRicateは、推定上の新しいAR遺伝子を検出する方法を提供しているが、上記のツールはいずれも簡単な検出方法を提供していない:既存のAR遺伝子、または耐性に関連する他の新規遺伝子またはバリアント。

 ここでは、修正されたARG-ANNOTデータベース、スタンドアロンのBLAST(ref.14)、および既知のAR遺伝子の検出を可能にする使いやすいグラフィカルユーザーインターフェイスを組み合わせたツールSSTAR(抗菌抵抗性のための配列検索ツール)推定された新しい変異体および切断された遺伝子を、迅速で、ローカルで、容易に更新可能なツールで予測する。

 

blastn解析をcontig配列と抗生物質耐性遺伝子間で実行し、耐性遺伝子を探すシンプルなツールです。

 

インストール

mac os10.13のjava1.8環境でテストした。

依存

本体 GIthub

本体をダウンロードして解凍する。

環境変数に以下のように定義しておく。(blastにパスが通ってなければフルパスで)。

export BLASTN="blastn"
export MAKEBLASTDB="makeblastdb"

 

ラン

1、contig配列の準備。

解析にはNGSデータをアセンブリして得られるcontig配列が必要になる。例えばspadesでd novoアセンブリを実行する(spades紹介)。オンラインで実行するなら、CyVerse(紹介)やGalaxy(training)を使う。

brew install spades
spades.py -1 pair1.fq.gz -2 pair2.fq.gz -k auto --careful -t 8 -o output

output/scaffolds.fastaができる。

 

2、実行

jarファイルを実行することでGUIパネルが出現する。

cd Sequence-Search-Tool-for-Antimicrobial-Resistance-SSTAR--master/
java -jar SSTAR.jar # *1

*1 windowsユーザーはSSTAR_windows.jarを実行する。

windowが出現する。

f:id:kazumaxneo:20180703102748p:plain

 

一番上のwindowにcontigを入力し、その下のwindowに検索した抗生物質耐性遺伝子のFASTAファイルを入力する。ダウンロードしたディレクトリに、ResfinderとARG-ANNOTから構築されたFASTAファイルがあるので、ここではそれを使う(Latest_AR_database/ResGANNOT_srst2.fasta)。3番目のウィンドウに検出下限閾値を記載し(0-1)、最後にIdentify resistance genes!をクリックして実行する。

 

blastn解析が終わると、検出された抗生物質耐性遺伝子と、耐性遺伝子が見つかったcontig名が表示される。ここではカナマイシン耐性カートリッジが入ったバクテリアのcontig配列を調べた。Aph3遺伝子がヒットしている。

f:id:kazumaxneo:20180703124123j:plain

 

引用

SSTAR, a Stand-Alone Easy-To-Use Antimicrobial Resistance Gene Predictor

Tom J. B. de Man, Brandi M. Limbago

mSphere. 2016 Jan-Feb; 1(1): e00050-15.