macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

RNA-seqのゲノムガイドアセンブリツール StringTie

 

StringTieはゲノムガイドのRNAアセンブリツール。cufflinksよりアセンブリ精度が高く、解析時間も短いと言われている。2015年にNature Biotechnologyに論文が発表された。

 

 

インストール

Github

https://github.com/gpertea/stringtie

brewで導入可能。

 

マニュアル

https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual

 

ラン

stringtie -p 12 input.bam --fr -G reference.gtf -o output.gtf 
  • -p number of threads (CPUs) to use (default: 1)
  • -o output path/file name for the assembled transcripts GTF (default: stdout)
  • -e only estimate the abundance of given reference transcripts (requires -G)
  • -G reference annotation to use for guiding the assembly process (GTF/GFF3)
  • --fr assume stranded library fr-secondstrand
  • --rf assume stranded library fr-firststrand -m minimum assembled transcript length (default: 200)
  • -t disable trimming of predicted transcripts based on coverage (default: coverage trimming is enabled)
  • -c minimum reads per bp coverage to consider for transcript assembly (default: 2.5)

他にも多様なオプションがある。

5GBのbamファイルの解析だと1時間くらいで終わります。

 

2020 1/9追記

引用

 StringTie enables improved reconstruction of a transcriptome from RNA-seq reads

Mihaela Pertea Geo M Pertea Corina M Antonescu Tsung-Cheng Chang Joshua T Mendell Steven L Salzberg

Nature Biotechnology 33, 290–295 (2015) 

 

http://www.nature.com/nprot/journal/v11/n9/full/nprot.2016.095.html

 

http://nextgenseek.com/2015/03/three-papers-on-new-rna-seq-methods-offer-a-new-way-to-do-rna-seq-analysis/