Projector 2はリファンレンスのゲノムを使い、de novo assemblyで作ったcontigをconcatenateして、さらに隣接したcontigを跨ぐ特異的なプライマーを自動設計して、Finishingを助けるツール。contigの接続の指標となる参照するゲノムはドラフトでも使える。リピートは予めマスクされ、contig間の特異的な増幅が期待できるプライマーペアが自動設計される。ゲノムのFinishingが目的なので、プライマーは長いcontigと長いcontigの末端近く(ただし末端に近くなり過ぎない)に設計される、短いcontig上には設計されない。発表されてから時間が経つが、今でも解析サーバーは保守されている。wetな研究者によって現在でも使われているのだと思われる。単にcontig末端にプライマーを設計するツールとしても使えるかもしれない。
webサーバー
http://bamics2.cmbi.ru.nl/websoftware/projector2/projector2_start.php
使い方
必要なもの
リファレンスゲノム(FASTA)とde novo assemblyで得られたcontig (FASTA)
ベストヒットするリファレンスが分からなければ、あらかじめblast解析を行ってベストヒットのFASTAをダウンロードしておく。NCBIなら、ヒットしたゲノムのリンクに飛んで右上からFASTAをダウンロード。
ゲノムが解読されたバクテリアはリファンレンスゲノム一覧からも選択できる。なければ、”ファイルを選択”でダウンロードしたFASTA、またはドラフトゲノムのFASTAを選ぶ。
Target genomeの”ファイルを選択”にはde novo assemblyで得られたcontig.fasta(scaffolds)を選択。"Upload Files"をクリック。
パラメータを決めたらラン。Proceedをクリック。
しばらく待つと結果のページが出てくる。
SVGには、ベクターグラフィックでプライマー位置がビジュアル表示される。
contigがリファレンスに従って並べられる。線の位置がプライマー設計サイトになる。contig間を跨ぐように設計されている。
primersを右クリックして"リンク先のファイルをダウンロード"でダウンロード。csvファイルなのでターミナルかexcelあたりで開く。ここではターミナルで開く。
user$ column -t < gap_primers_1.txt | less -#2 -N -S #整形表示
設計されたプライマー表示されている。
同様にgap-flanking sequencesを開く。
gapごとに推定増幅配列がまとめられている。gap名は上のprimersのファイルt対応している。
そのほか
Pseudoassemblyを押すと、リピートがNでマスクされプライマーデザインに使われたドラフトゲノムが表示される。
Gap-closing primers (circular genome) (TAB)にはcircularゲノムを閉じるためのプライマーが表示されている。
IGVで見ると下のような感じになる(上がcontig、下が設計されたprimer x2)。bwa memでプライマーをアライメントするなら、-T 5 -k 10などをつけて実行してください)
参照のゲノムが間違っていた場合、出力されたプライマーの組み合わせでは増えないことになりますが、プライマーが無駄になるわけではりません。別の手法で順番を予測して、そのPCRに使うことができますし、数が少なければ総当たりPCRしてもいいかもしれません。良いツールです。
引用
Projector 2: contig mapping for efficient gap-closure of prokaryotic genome sequence assemblies
Sacha A. F. T. van Hijum,* Aldert L. Zomer, Oscar P. Kuipers, and Jan Kok
Nucleic Acids Res. 2005 Jul 1; 33(Web Server issue): W560–W566.