macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ターゲットゲノムにしかない配列を探し出すEAGLE

 

EAGLEは指定したゲノムにしかない配列を検出するツール。論文では、EAGLEを使い、ヒトゲノムのどこにもない、エボラウィルスからしか見つからない14merの配列を検出している。特定の種のみ存在する配列があれば、ユニークなプライマーを設計したり、RNA干渉のターゲットにするなど、様々な用途に応用できる可能性がある。また変異株の変異をリファレンスフリーで検出可能な方法論にも応用可能で、すでにいくつかの方法論が発表されている。EAGLEと似たツールにGenomeTester4がある(リンク)。

 

インストール

本体 Github

https://github.com/pratas/eagle

ダウンロードしてビルドする。 

brew install cmake wget gcc48 #ない人だけ

wget https://github.com/pratas/eagle/archive/master.zip
unzip master.zip
cd eagle-master/src/
cmake .
make

 > ./EAGLE

$ ./EAGLE 

Usage: EAGLE <OPTIONS>... -r [FILE]  [FILE]:<...>    

                                                     

  -v                       verbose mode,             

  -a                       about EAGLE,              

  -t                       use multi-threading,      

  -i                       use inversions,           

  -min <k-mer>             k-mer minimum size,       

  -max <k-mer>             k-mer maximum size,       

                                                     

  -r [rFile]               reference file (db),      

                                                     

  [tFile1]:<tFile2>:<...>  target file(s).           

                                               

パスを通しておく。

 

ラン

 k=9からk=13まで探索する。

EAGLE -v -t -min 9 -max 13 -i -r ref.fa target.fa
  • -t use multi-threading
  • -min <k-mer>  k-mer minimum size
  • -max <k-mer>  k-mer maximum size
  • -r [rFile]   reference file (db)

 

引用

Three minimal sequences found in Ebola virus genomes and absent from human DNA

Raquel M. Silva Diogo Pratas Luísa Castro Armando J. Pinho Paulo J. S. G. Ferreira

Bioinformatics, Volume 31, Issue 15, 1 August 2015, Pages 2421–2425