macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

RNAMMERでrRNAを探す。

 

fastaからrRNA配列を探すツール。アノテーションに使えるのはもちろんだが、それだけでなく、de novo transcriptome解析などで、rRNAにマッピングされるリードを排除するため、rRNAをもれなく検索したい時などにも使えると思われる。

 

 

webサーバー版

http://www.cbs.dtu.dk/services/RNAmmer/

 

manual

http://www.cbs.dtu.dk/cgi-bin/nph-runsafe?man=rnammer

 

usage

RNAmmer 1.2 Server

 

出力フォーマット

http://www.cbs.dtu.dk/services/RNAmmer/output.php

 

 

インストー

brewでインストールできる。

brew install RNAMMER

以前はランにはhmmsearchのversion2が必要だったようだが、brewでインストールされる現行バージョンはHMMER 3.1b2の存在下で動作するようである。

 

ダウンロード

http://www.cbs.dtu.dk/cgi-bin/sw_request?rnammer

test用のゲノムがある。 rRNA遺伝子のポジションが分かっている既知のゲノム配列を持っていれば、それを使って検証するとよい。

 

 

ラン

rnammer -S bac -m lsu,ssu,tsu -f output.fasta -gff output.gtf ecoli.fsa
  • -S Specifies the super kingdom of the input sequence. e.g., ani, arc
  • -m Molecule type can be 'tsu' for 5/8s rRNA, 'ssu' for 16/18s rRNA, 'lsu' for 23/28s rRNA or any combination seperated by comma. h hmmreport
  • -f fasta(出力)
  • -gff gff(出力)
  • -xml xml(出力)

最後に解析するfasta(input.fasta)を入力する。テストではsampleデータのE.coliゲノムを指定している。また検索したいrRNAのタイプを-mで指定している。ssuならSmall subunit

解析が終わるとオプションで指定したファイルが出力される。上ではfastaとgtfを指定している。

output.fasta

user$ head -10 output.fasta

>rRNA_ecoli_section_21067-21181_DIR+ /molecule=5s_rRNA /score=86.3

TGGCGGCAGTAGCGCGGTGGTCCCACCTGACCCCATGCCGAACTCAGAAGTGAAACGCCG

TAGCGCCGATGGTAGTGTGGGGTCTCCCCATGCGAGAGTAGGGAACTGCCAGGCA

>rRNA_ecoli_section_16177-17706_DIR+ /molecule=16s_rRNA /score=1950.6

AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAAC

GGTAACAGGAAGAAGCTTGCTTCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGG

GAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCG

CAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAG

CTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGAC

CAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATAT

output.gtf

user$ head -10 output.gtf

##gff-version2

##source-version RNAmmer-1.2

##date 2017-07-30

##Type DNA

# seqname           source                      feature     start      end   score   +/-  frame  attribute

# ---------------------------------------------------------------------------------------------------------

ecoli_section RNAmmer-1.2 rRNA 21067 21181 86.3 + . 5s_rRNA

ecoli_section RNAmmer-1.2 rRNA 16177 17706 1950.6 + . 16s_rRNA

ecoli_section RNAmmer-1.2 rRNA 18068 20969 3754.0 + . 23s_rRNA

# ---------------------------------------------------------------------------------------------------------

 

他にもxmlやhmmerの分析 ファイルが出力可能となっている。xmlファイルはwebサーバーなどに使う。

  

 

引用

RNAmmer: consistent and rapid annotation of ribosomal RNA genes

Karin Lagesen,1,2,* Peter Hallin,3 Einar Andreas Rødland,1,2,4,5 Hans-Henrik Stærfeldt,3 Torbjørn Rognes,1,2,4 and David W. Ussery1,2,3

Nucleic Acids Res. 2007 May; 35(9): 3100–3108.