2021 5/26 論文引用
Documentation (検出対象のPathwayとその引用も載っている)
gutSMASH documentation — gutsmash.docs 0.0.1 documentation
mamba create -n gutSMASH python=3.6 -y
conda activate gutSMASH
pip3 install bcbio-gff pysvg-py3 scikit-learn matplotlib pyScss Jinja2
mamba install -c bioconda -y glimmerhmm
mamba install -c bioconda -y muscle
mamba install -c bioconda -y blast
mamba install -c bioconda -y prodigal
mamba install -c bioconda -y fasttree
mamba install -c bioconda -y diamond
mamba install -c bioconda -y hmmer
mamba install -c bioconda -y hmmer2
mamba install -c bioconda -y helperlibs
mamba install -c bioconda -y biopython=1.68
git clone https://github.com/victoriapascal/gutsmash.git
> python3 gutsmash/run_gutsmash.py
########### gutSMASH 1.0.0-32bee55 #############
usage: run_gutsmash.py [-h] [options ..] sequence
SEQUENCE GenBank/EMBL/FASTA file(s) containing DNA.
-h, --help Show this help text.
--help-showall Show full lists of arguments on this help text.
-c CPUS, --cpus CPUS How many CPUs to use in parallel. (default: 128)
Basic analysis options:
--taxon {bacteria,fungi}
Taxonomic classification of input sequence. (default:
Additional analysis:
--fullhmmer Run a whole-genome HMMer analysis.
--cassis Motif based prediction of SM gene cluster regions.
--cf-borders-only Only annotate borders of existing clusters.
--cf-create-clusters Find extra clusters.
--clusterhmmer Run a cluster-limited HMMer analysis.
--smcog-trees Generate phylogenetic trees of sec. met. cluster
orthologous groups.
Lowest GC content to annotate TTA codons at (default:
--cb-general Compare identified clusters against a database of
antiSMASH-predicted clusters.
--cb-knownclusters Compare identified clusters against known gene
clusters from the MIBiG database.
--asf Run active site finder analysis.
--pfam2go Run Pfam to Gene Ontology mapping module.
Output options:
--output-dir OUTPUT_DIR
Directory to write results to.
--html-title HTML_TITLE
Custom title for the HTML output page (default is
input filename).
--html-description HTML_DESCRIPTION
Custom description to add to the output.
Gene finding options (ignored when ORFs are annotated):
--genefinding-tool {glimmerhmm,prodigal,prodigal-m,none,error}
Specify algorithm used for gene finding: GlimmerHMM,
Prodigal, Prodigal Metagenomic/Anonymous mode, or
none. The 'error' option will raise an error if
genefinding is attempted. The 'none' option will not
run genefinding. (default: error).
--genefinding-gff3 GFF3_FILE
Specify GFF3 file to extract features from.
gutSMASHのランにはGenbank形式またはEMBL形式のアノテーションされたヌクレオチドファイルが必要(for example ".fasta", ".fa", ".gb", ".gbff", ".gbk", or ".embl")。最もシンプルな解析(MGCの検出のみ)を行うには、--minimal フラグだけ指定する。
python3 gutsmash/run_gutsmash.py --minimal input.gbk
Annotation of functional gene categories が有効になっている場合、遺伝子のボックスはパスウェイにおける機能に基づいて色分けされている。遺伝子をクリックすると、その遺伝子のアノテーション、クラスタ内の他の遺伝子との配列の類似性、位置、その遺伝子に特有のクロスリンクなどの詳細情報が表示される。クエスチョンマークはヘルプページにリンクしている。感嘆符のボタンは、gutSMASHについての説明のページに繋がっている。下向きの矢印は、gutSMASHの実行結果の全セットをダウンロードするためのメニューになっている。ダンロードしたEMBL/GenBankファイルはArtemisのようなゲノムブラウザで見ることができる。
- --cb-knownclustersフラグを用いて、予測された遺伝子クラスターを既知の特徴的な遺伝子クラスターのデータベースと比較する。このオプションは指定することが推奨されている。
- gutsSMASHはFASTAファイルを入力として使用することもできる。その場合、--genefinding-toolオプションを使ってゲノムにアノテーションするための遺伝子予測ツール、例えばProdigal、を選択する。
- Gene Cluster Comparative Analysis (ClusterBlast)を有効にすると、遺伝子クラスタのページに、3つの異なるバクテリアリファレンスコレクションで事前に計算されたgutSMASHランから最も類似したMGCのトップ10が表示される。ドロップダウン式の選択メニューを使って、遺伝子クラスターを参照することができる。
A systematic analysis of metabolic pathways in the human gut microbiota
Victòria Pascal Andreu, Hannah E. Augustijn, Lianmin Chen, Alexandra Zhernakova,Jingyuan Fu, Michael A. Fischbach, Dylan Dodd, Marnix H. Medema
bioRxiv, Posted February 26, 2021
The gutSMASH web server: automated identification of primary metabolic gene clusters from the gut microbiota
Victòria Pascal Andreu, Jorge Roel-Touris, Dylan Dodd, Michael A Fischbach, Marnix H Medema
Nucleic Acids Research, Published: 21 May 2021