2020 8/22 関連ツールリンク追記
2023/02/28 追記
fastaからrRNA配列を探すツール。アノテーションに使えるのはもちろんだが、それだけでなく、de novo transcriptome解析などで、rRNAにマッピングされるリードを排除するため、rRNAをもれなく検索したい時などにも使えると思われる。
webサーバー版(DISCONTINUED)
http://www.cbs.dtu.dk/services/RNAmmer/
manual (DISCONTINUED)
http://www.cbs.dtu.dk/cgi-bin/nph-runsafe?man=rnammer
usage
出力フォーマット
http://www.cbs.dtu.dk/services/RNAmmer/output.php
インストール
brewでインストールできる。
brew install RNAMMER
以前はランにはhmmsearchのversion2が必要だったようだが、brewでインストールされる現行バージョンはHMMER 3.1b2の存在下で動作するようである。
ダウンロード
http://www.cbs.dtu.dk/cgi-bin/sw_request?rnammer
test用のゲノムがある。 rRNA遺伝子のポジションが分かっている既知のゲノム配列を持っていれば、それを使って検証するとよい。
実行方法
rnammer -S bac -m lsu,ssu,tsu -f output.fasta -gff output.gtf ecoli.fsa
- -S Specifies the super kingdom of the input sequence. e.g., ani, arc
- -m Molecule type can be 'tsu' for 5/8s rRNA, 'ssu' for 16/18s rRNA, 'lsu' for 23/28s rRNA or any combination seperated by comma. h hmmreport
- -f fasta(出力)
- -gff gff(出力)
- -xml xml(出力)
最後に解析するfasta(input.fasta)を入力する。テストではsampleデータのE.coliゲノムを指定している。また検索したいrRNAのタイプを-mで指定している。ssuならSmall subunit。
解析が終わるとオプションで指定したファイルが出力される。上ではfastaとgtfを指定している。
output.fasta
user$ head -10 output.fasta
>rRNA_ecoli_section_21067-21181_DIR+ /molecule=5s_rRNA /score=86.3
TGGCGGCAGTAGCGCGGTGGTCCCACCTGACCCCATGCCGAACTCAGAAGTGAAACGCCG
TAGCGCCGATGGTAGTGTGGGGTCTCCCCATGCGAGAGTAGGGAACTGCCAGGCA
>rRNA_ecoli_section_16177-17706_DIR+ /molecule=16s_rRNA /score=1950.6
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAAC
GGTAACAGGAAGAAGCTTGCTTCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGG
GAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCG
CAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAG
CTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGAC
CAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATAT
output.gtf
user$ head -10 output.gtf
##gff-version2
##source-version RNAmmer-1.2
##date 2017-07-30
##Type DNA
# seqname source feature start end score +/- frame attribute
# ---------------------------------------------------------------------------------------------------------
ecoli_section RNAmmer-1.2 rRNA 21067 21181 86.3 + . 5s_rRNA
ecoli_section RNAmmer-1.2 rRNA 16177 17706 1950.6 + . 16s_rRNA
ecoli_section RNAmmer-1.2 rRNA 18068 20969 3754.0 + . 23s_rRNA
# ---------------------------------------------------------------------------------------------------------
他にもxmlやhmmerの分析 ファイルが出力可能となっている。xmlファイルはwebサーバーなどに使う。
2023/02/28追記
yookudaさんのdocker imageを使用させてもらう。
docker pull yookuda/rnammer-1.2:1.0
cd genome_dir/
docker rn --rm $PWD:/data -w /data yookuda/rnammer-1.2:1.0
> rnammer -S euk -m lsu,ssu,tsu -f output.fasta -gff output.gtf input_genome.fna
(ありがとうございます)
引用
RNAmmer: consistent and rapid annotation of ribosomal RNA genes
Karin Lagesen,1,2,* Peter Hallin,3 Einar Andreas Rødland,1,2,4,5 Hans-Henrik Stærfeldt,3 Torbjørn Rognes,1,2,4 and David W. Ussery1,2,3
Nucleic Acids Res. 2007 May; 35(9): 3100–3108.
関連