macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

リファレンスゲノム情報を使ってcontigをソートし、ギャップクローズのPCRプライマーを自動設計するProjector 2

 

Projector 2はリファンレンスのゲノムを使い、de novo assemblyで作ったcontigをconcatenateして、さらに隣接したcontigを跨ぐ特異的なプライマーを自動設計して、Finishingを助けるツール。contigの接続の指標となる参照するゲノムはドラフトでも使える。リピートは予めマスクされ、contig間の特異的な増幅が期待できるプライマーペアが自動設計される。ゲノムのFinishingが目的なので、プライマーは長いcontigと長いcontigの末端近く(ただし末端に近くなり過ぎない)に設計される、短いcontig上には設計されない。発表されてから時間が経つが、今でも解析サーバーは保守されている。wetな研究者によって現在でも使われているのだと思われる。単にcontig末端にプライマーを設計するツールとしても使えるかもしれない。

 

webサーバー

http://bamics2.cmbi.ru.nl/websoftware/projector2/projector2_start.php

 

使い方

必要なもの

リファレンスゲノム(FASTA)とde novo assemblyで得られたcontig (FASTA)

ベストヒットするリファレンスが分からなければ、あらかじめblast解析を行ってベストヒットのFASTAをダウンロードしておく。NCBIなら、ヒットしたゲノムのリンクに飛んで右上からFASTAをダウンロード。

f:id:kazumaxneo:20171225133052j:plain

 

  

ゲノムが解読されたバクテリアはリファンレンスゲノム一覧からも選択できる。なければ、”ファイルを選択”でダウンロードしたFASTA、またはドラフトゲノムのFASTAを選ぶ。

f:id:kazumaxneo:20171225132332j:plain

 

Target genomeの”ファイルを選択”にはde novo assemblyで得られたcontig.fasta(scaffolds)を選択。"Upload Files"をクリック。

 

パラメータを決めたらラン。Proceedをクリック。

f:id:kazumaxneo:20171225133647j:plain

 

 

しばらく待つと結果のページが出てくる。

f:id:kazumaxneo:20171225133824j:plain

 

SVGには、ベクターグラフィックでプライマー位置がビジュアル表示される。

f:id:kazumaxneo:20171225133927j:plain

contigがリファレンスに従って並べられる。線の位置がプライマー設計サイトになる。contig間を跨ぐように設計されている。

 

primersを右クリックして"リンク先のファイルをダウンロード"でダウンロード。csvファイルなのでターミナルかexcelあたりで開く。ここではターミナルで開く。

user$ column -t < gap_primers_1.txt | less -#2 -N -S #整形表示

f:id:kazumaxneo:20171225134519j:plain

設計されたプライマー表示されている。

 

同様にgap-flanking sequencesを開く。

f:id:kazumaxneo:20171225135407j:plain

gapごとに推定増幅配列がまとめられている。gap名は上のprimersのファイルt対応している。

 

そのほか

Pseudoassemblyを押すと、リピートがNでマスクされプライマーデザインに使われたドラフトゲノムが表示される。

Gap-closing primers (circular genome) (TAB)にはcircularゲノムを閉じるためのプライマーが表示されている。

 

 

IGVで見ると下のような感じになる(上がcontig、下が設計されたprimer x2)。bwa memでプライマーをアライメントするなら、-T 5 -k 10などをつけて実行してください)

f:id:kazumaxneo:20171225135754j:plain

 

 

 

参照のゲノムが間違っていた場合、出力されたプライマーの組み合わせでは増えないことになりますが、プライマーが無駄になるわけではりません。別の手法で順番を予測して、そのPCRに使うことができますし、数が少なければ総当たりPCRしてもいいかもしれません。良いツールです。

 

引用

Projector 2: contig mapping for efficient gap-closure of prokaryotic genome sequence assemblies

Sacha A. F. T. van Hijum,* Aldert L. Zomer, Oscar P. Kuipers, and Jan Kok

Nucleic Acids Res. 2005 Jul 1; 33(Web Server issue): W560–W566.