macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

アセンブリの簡単なstatisticsを出力する assembly-stats

 

assembly-statsはsanger-pathogensのGithubレポジトリで公開されているアセンブリ配列の簡単な要約統計を出力するツール。

 

インストール

mac os10.13でテストした。

本体 Github

#Anaconda環境ならcondaでインストールできる
conda install -c bioconda assembly-stats

 

ラン

fastaを指定する。

assembly-stats contig.fa

 テストラン結果

assembly-stats scaffolds.fasta 

stats for scaffolds.fasta

sum = 3607906, n = 143, ave = 27328.01, largest = 352340

N50 = 150563, n = 9

N60 = 104976, n = 12

N70 = 89580, n = 16

N80 = 62878, n = 21

N90 = 41202, n = 28

N100 = 128, n = 143

N_count = 99

Gaps = 1

 

BBtools(紹介)でも似たことができる。

#contig.fasstaを分析
stats.sh in=contigs.fa gc=gc.txt gcformat=4

ミスアセンブリなど詳細を調べたいならQuestを使ってください。

 

引用

GitHub - sanger-pathogens/assembly-stats: Get assembly statistics from FASTA and FASTQ files

 

参考

https://www.biostars.org/p/237591/

 

GenomeやRNA-Seq assemblyの結果を確認する: assembly-statsについて - NGSデータ解析まとめ