ハイスループットシーケンシング(HTS)は、微生物学者の日常的な分析に不可欠な要素となっている。数十のサンプルをシーケンシングするプロセスでは、手作業ではアノテーションを付与できない膨大な量のデータが生成される。この課題に対処するため、長年にわたり、細菌ゲノム解析用のツールが数多く開発されてきた。これらのツールは、無料で利用できるデータベースを利用することで、ユーザーの分析を大幅に加速させる。しかし、これらのツールの多くは、効果的に操作するために高度なコンピュータサイエンスの専門知識を必要とする。この限界を克服するために、本著者らはBacExplorerを開発した。ユーザーフレンドリーなインターフェース、ローカルにインストール可能なアプリケーション、そしてインタラクティブなHTMLレポートを備えたBacExplorerは、あらゆるスキルレベルのユーザーが簡単かつ効率的に独自の分析を実行できるようにする。BacExplorerは、https://github.com/knowmics-lab/BacExplorerから入手できる。
インストール
System Requirements
- Installation: at least 36 GB of storage space required.
- FASTA analysis: at least 8 GB of RAM required to perform the analysis on one sample.
- FASTQ analysis: at least 8 GB of RAM required to perform the analysis on one sample.
- Kraken2: at least 8GB of RAM required. Otherwise Kraken will be skipped.
- geNomad: the tool can perform only on x86/x64 architectures. If your machine has got an ARM processor, geNomad will be skipped.

インストーラーを開き、指示に従って導入する。Dockerが起動している必要がある。

Setupには20分ほどかかった。

実行方法
インストール後はアプリとして起動する。

起動した。

ペアエンドのfastqを含むディレクトリを指定する。このディレクトリにほかのファイルがあると認識しなくなるので注意する。ペアエンドfastqは以下を認識する。
_1.fastq.gz _2.fastq.gz
_R1.fastq.gz _R2.fastq.gz
_R1_L001.fastq.gz _R2_L001.fastq.gz
_1.fq.gz _2.fq.gz
_R1.fq.gz _R2.fq.gz
_R1_L001.fq.gz _R2_L001.fq.gz
Lauchする。

解析には時間がかかる。

進捗バーの進みが悪いが、ウィンドウを消さない限り、計算は進行している。
出力例 (元のfastqはfastq/に移動され、そのパスにspadesのアセンブリ結果が出ている)

output/

暫く経つと、解析はいつの間にか進んでいたが進捗バーが進まず、新しいジョブも出なくなった。本来は結果のレポートページが表示されるはずだが、どこかで停止したと思われる(logが出ないので不明)。

引用
BacExplorer: an integrated platform for de novo bacterial genome annotation Open Access
Grete Francesca Privitera , Adriana Antonella Cannata , Floriana Campanile , Salvatore Alaimo , Dafne Bongiorno , Alfredo Pulvirenti
Bioinformatics Advances, Volume 5, Issue 1, 2025
関連