タイトルの通りのツール。入力アセンブリ配列の簡単な要約統計をJSON形式で出力する。 開発の動機は、assemblathon-stats.plやassembly-statsなどの代替手段があるものの、これらはJSONを出力しなかったためと記載されている。
インストール
macos10.14のpython3.7環境でテストした。
既存
- Python >= 3.4
#bioconda (link)
conda install -c bioconda -y assembly-scan
> assembly-scan -h
assembly-scan -h
usage: assembly-summary.py [-h] [--version] ASSEMBLY
Generate statistics for a given assembly.
positional arguments:
ASSEMBLY FASTA file to read (gzip or uncompressed)
optional arguments:
-h, --help show this help message and exit
--version show program's version number and exit
実行方法
contigファイルを指定する。
assembly-scan contig.fasta
出力
{
"contig_non_acgtn": "0.00",
"contig_percent_a": "26.21",
"contig_percent_c": "23.78",
"contig_percent_g": "23.69",
"contig_percent_n": "0.00",
"contig_percent_t": "26.32",
"contigs_greater_100k": 13,
"contigs_greater_10k": 45,
"contigs_greater_1k": 74,
"contigs_greater_1m": 0,
"l50_contig_count": 10,
"max_contig_length": 388492,
"mean_contig_length": 24319,
"median_contig_length": 520,
"min_contig_length": 100,
"n50_contig_length": 114552,
"num_contig_non_acgtn": 0,
"percent_contigs_greater_100k": "8.12",
"percent_contigs_greater_10k": "28.12",
"percent_contigs_greater_1k": "46.25",
"percent_contigs_greater_1m": "0.00",
"total_contig": 160,
"total_contig_length": 3891196
}
引用
GitHub - rpetit3/assembly-scan: Generate basic stats for an assembly.
関連