StringTieはゲノムガイドのRNAアセンブリツール。cufflinksよりアセンブリ精度が高く、解析時間も短いと言われている。2015年にNature Biotechnologyに論文が発表された。
インストール
https://github.com/gpertea/stringtie
brewで導入可能。
マニュアル
https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual
ラン
stringtie -p 12 input.bam --fr -G reference.gtf -o output.gtf
- -p number of threads (CPUs) to use (default: 1)
- -o output path/file name for the assembled transcripts GTF (default: stdout)
- -e only estimate the abundance of given reference transcripts (requires -G)
- -G reference annotation to use for guiding the assembly process (GTF/GFF3)
- --fr assume stranded library fr-secondstrand
- --rf assume stranded library fr-firststrand -m minimum assembled transcript length (default: 200)
- -t disable trimming of predicted transcripts based on coverage (default: coverage trimming is enabled)
- -c minimum reads per bp coverage to consider for transcript assembly (default: 2.5)
他にも多様なオプションがある。
5GBのbamファイルの解析だと1時間くらいで終わります。
2020 1/9追記
引用
StringTie enables improved reconstruction of a transcriptome from RNA-seq reads
Mihaela Pertea Geo M Pertea Corina M Antonescu Tsung-Cheng Chang Joshua T Mendell Steven L Salzberg
Nature Biotechnology 33, 290–295 (2015)
http://www.nature.com/nprot/journal/v11/n9/full/nprot.2016.095.html