macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

assemblyの分析結果をJSON形式で出力する assembly-scan

 

タイトルの通りのツール。入力アセンブリ配列の簡単な要約統計をJSON形式で出力する。 開発の動機は、assemblathon-stats.plやassembly-statsなどの代替手段があるものの、これらはJSONを出力しなかったためと記載されている。

 

インストール

macos10.14のpython3.7環境でテストした。

既存

本体 Github

#bioconda (link)
conda install -c bioconda -y assembly-scan

assembly-scan -h

 assembly-scan -h

usage: assembly-summary.py [-h] [--version] ASSEMBLY

 

Generate statistics for a given assembly.

 

positional arguments:

  ASSEMBLY    FASTA file to read (gzip or uncompressed)

 

optional arguments:

  -h, --help  show this help message and exit

  --version   show program's version number and exit

 

 

実行方法

contigファイルを指定する。

assembly-scan contig.fasta

出力

{

    "contig_non_acgtn": "0.00",

    "contig_percent_a": "26.21",

    "contig_percent_c": "23.78",

    "contig_percent_g": "23.69",

    "contig_percent_n": "0.00",

    "contig_percent_t": "26.32",

    "contigs_greater_100k": 13,

    "contigs_greater_10k": 45,

    "contigs_greater_1k": 74,

    "contigs_greater_1m": 0,

    "l50_contig_count": 10,

    "max_contig_length": 388492,

    "mean_contig_length": 24319,

    "median_contig_length": 520,

    "min_contig_length": 100,

    "n50_contig_length": 114552,

    "num_contig_non_acgtn": 0,

    "percent_contigs_greater_100k": "8.12",

    "percent_contigs_greater_10k": "28.12",

    "percent_contigs_greater_1k": "46.25",

    "percent_contigs_greater_1m": "0.00",

    "total_contig": 160,

    "total_contig_length": 3891196

}

 

 

引用

GitHub - rpetit3/assembly-scan: Generate basic stats for an assembly.

 

関連