macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

rRNAを探索する RNAMMER

2020 8/22 関連ツールリンク追記

2023/02/28 追記

 

fastaからrRNA配列を探すツール。アノテーションに使えるのはもちろんだが、それだけでなく、de novo transcriptome解析などで、rRNAにマッピングされるリードを排除するため、rRNAをもれなく検索したい時などにも使えると思われる。

 

webサーバー版(DISCONTINUED)

http://www.cbs.dtu.dk/services/RNAmmer/

 manual (DISCONTINUED)

http://www.cbs.dtu.dk/cgi-bin/nph-runsafe?man=rnammer

 usage

RNAmmer 1.2 Server

 出力フォーマット

http://www.cbs.dtu.dk/services/RNAmmer/output.php

 

インストール

brewでインストールできる。

brew install RNAMMER

以前はランにはhmmsearchのversion2が必要だったようだが、brewでインストールされる現行バージョンはHMMER 3.1b2の存在下で動作するようである。

 ダウンロード

http://www.cbs.dtu.dk/cgi-bin/sw_request?rnammer

test用のゲノムがある。 rRNA遺伝子のポジションが分かっている既知のゲノム配列を持っていれば、それを使って検証するとよい。

 

 実行方法

rnammer -S bac -m lsu,ssu,tsu -f output.fasta -gff output.gtf ecoli.fsa
  • -S Specifies the super kingdom of the input sequence. e.g., ani, arc
  • -m Molecule type can be 'tsu' for 5/8s rRNA, 'ssu' for 16/18s rRNA, 'lsu' for 23/28s rRNA or any combination seperated by comma. h hmmreport
  • -f fasta(出力)
  • -gff gff(出力)
  • -xml xml(出力)

最後に解析するfasta(input.fasta)を入力する。テストではsampleデータのE.coliゲノムを指定している。また検索したいrRNAのタイプを-mで指定している。ssuならSmall subunit。

 

解析が終わるとオプションで指定したファイルが出力される。上ではfastaとgtfを指定している。

output.fasta

user$ head -10 output.fasta

>rRNA_ecoli_section_21067-21181_DIR+ /molecule=5s_rRNA /score=86.3

TGGCGGCAGTAGCGCGGTGGTCCCACCTGACCCCATGCCGAACTCAGAAGTGAAACGCCG

TAGCGCCGATGGTAGTGTGGGGTCTCCCCATGCGAGAGTAGGGAACTGCCAGGCA

>rRNA_ecoli_section_16177-17706_DIR+ /molecule=16s_rRNA /score=1950.6

AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAAC

GGTAACAGGAAGAAGCTTGCTTCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGG

GAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCG

CAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAG

CTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGAC

CAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATAT

output.gtf

user$ head -10 output.gtf

##gff-version2

##source-version RNAmmer-1.2

##date 2017-07-30

##Type DNA

# seqname           source                      feature     start      end   score   +/-  frame  attribute

# ---------------------------------------------------------------------------------------------------------

ecoli_section RNAmmer-1.2 rRNA 21067 21181 86.3 + . 5s_rRNA

ecoli_section RNAmmer-1.2 rRNA 16177 17706 1950.6 + . 16s_rRNA

ecoli_section RNAmmer-1.2 rRNA 18068 20969 3754.0 + . 23s_rRNA

# ---------------------------------------------------------------------------------------------------------

他にもxmlやhmmerの分析 ファイルが出力可能となっている。xmlファイルはwebサーバーなどに使う。

  

2023/02/28追記

yookudaさんのdocker imageを使用させてもらう。

docker pull yookuda/rnammer-1.2:1.0
cd genome_dir/
docker rn --rm $PWD:/data -w /data yookuda/rnammer-1.2:1.0
> rnammer -S euk -m lsu,ssu,tsu -f output.fasta -gff output.gtf input_genome.fna

(ありがとうございます)

 

引用

RNAmmer: consistent and rapid annotation of ribosomal RNA genes

Karin Lagesen,1,2,* Peter Hallin,3 Einar Andreas Rødland,1,2,4,5 Hans-Henrik Stærfeldt,3 Torbjørn Rognes,1,2,4 and David W. Ussery1,2,3

Nucleic Acids Res. 2007 May; 35(9): 3100–3108.

 


関連