抗菌剤耐性(AMR)は世界的な健康問題である。微生物サンプルのハイスループットなメタゲノムシークエンシングにより、精選されたAMRデータベースとの比較によるAMR遺伝子のプロファイリングが可能になる。しかし、データベースの不完全性や、シークエンシングされたサンプル中の他の非AMR遺伝子との相同性/同形形質の存在により、現在の手法の性能はしばしば妨げられる。
AMR-metaは、データベースもアライメントも不要で、k-mersに基づく、代数的行列分解と正則化回帰を組み合わせたメタフィーチャの手法である。メタフィーチャーは、主な抗生物質クラスにわたるマルチレベルの遺伝子多様性を捉える。AMR-metaは、メタゲノムショットガンシーケンスから得られたリードを取り込み、それらのリードが特定の抗生物質クラスに対する耐性に寄与しているかどうかを予測し出力する。さらに、AMR-metaは、AMR遺伝子データベースと非AMR遺伝子(ネガティブな例として使用)を結合する拡張学習ストラテジーを使用している。AMR-metaをAMRPlusPlus、DeepARG、Meta-MARCと比較し、さらにvoting systemによりアンサンブルをテストした。クロスバリデーションでは、AMR-metaのfスコアの中央値は0.7(四分位範囲、0.2-0.9)であった。半合成メタゲノム・データ(外部テスト)において、AMR-metaは既存の手法と比較して平均1.3倍のヒット率向上を実現した。実行時間では、AMR-metaはDeepARGの3倍、Meta-MARCの30倍、AMRPlusPlusと同程度の速さである。最後に、AMRオントロジーの違いや、すべてのツールで分類結果にばらつきが見られることから、ベンチマークデータやプロトコルの標準化について、さらなる開発が必要であることを指摘する。AMR-metaは、非AMRネガティブセットを利用して感度と特異性を向上させる、高速かつ高精度な分類器である。AMRオントロジーの違いや分類結果のばらつきが大きいことから、AMR予測ツールを公平に比較するための標準的なベンチマークデータとプロトコルの導入が必要である。
インストール
ubuntu18でテストした。
依存
- AMR-meta is developed in Linux, ad utilizes Bash, C++, and R
- AMR-meta uses the following R packages: Matrix, stringr, glmnet.
git clone https://github.com/smarini/AMR-meta.git
cd AMR-meta/
make -j8
# Singularity
download link
> ./AMR-meta.sh: illegal option -- h
********************************************
Usage: ./AMR-meta.sh
./AMR-meta.sh -a FASTQ_R1 -b FASTQ_R2 -o OUT_DIR -p NCORES
-a short read R1 file [fastq]
-b short read R2 file [fastq]
-o output directory, defaults to output
-p # of cores for parallel computing, defaults to 1
Singularity:
singularity run amrmeta.sif -a FASTQ_R1 -b FASTQ_R2 -o OUT_DIR -p NCORES
********************************************
examples of use:
./AMR-meta.sh -a data/example/example_R1.fastq \
-b data/example/example_R2.fastq \
-o output \
-p 4
singularity run amrmeta.sif -a data/example/example_R1.fastq \
-b data/example/example_R2.fastq \
-o output \
-p 4
********************************************
テストラン
fastqを指定する。fastqは非圧縮の状態で提供する必要がある。
cd AMR-meta/
./AMR-meta.sh -a data/example/example_R1.fastq -b data/example/example_R2.fastq -o output -p 4
#singularity
singularity run amrmeta.sif -a data/example/example_R1.fastq \
-b data/example/example_R2.fastq -o output -p 4
- -a short read R1 file [fastq]
- -b short read R2 file [fastq]
- -o output directory, defaults to output
- -p # of cores for parallel computing, defaults to 1
出力
output/
全てのペアエンドショートリードについて、各モデルが抵抗性であるとラベル付けされる確率がプリントされる(ペアエンドリード数が多いと結果が肥大するので注意)。
AMRのクラスは13種類に分類されている。
- Aminoglycosides
- Betalactams
- Drug and biocide resistance
- Fluoroquinolones
- Glycopeptides
- Lipopeptides
- MLS
- Multi-biocide resistance
- Multi-drug resistance
- Multi-metal resistance
- Phenicol
- Sulfonamides
- Tetracyclines
引用
AMR-meta: a k-mer and metafeature approach to classify antimicrobial resistance from high-throughput short-read metagenomics data
Simone Marini, Marco Oliva, Ilya B Slizovskiy, Rishabh A Das, Noelle Robertson Noyes, Tamer Kahveci, Christina Boucher, Mattia Prosperi
GigaScience, Volume 11, 2022
関連