macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

(コムギなど)倍数性ゲノムのホモログ特異的なプライマーを自動作成する AutoCloner

2020 7/27 誤字修正

 

 小麦のような倍数性の生物は、分子生物学の最も単純な手順さえも複雑にしている。農作物のゲノム配列に関する知識は急速に増加しているが、研究者の間では、すべての種の完全な全ゲノムを作成するまでにはまだ長い道のりがある。そのため、ポリメラーゼ連鎖反応やサンガー塩基配列決定法は、多くの品種の作物の遺伝子配列を特徴づけるための方法として広く使われている。ポリプロイドゲノム間の配列類似性が高いということは、3'テイルにSNPを組み込むことでプライマーがホメオログ特異的にならない場合、標的配列以外の配列も増幅されることを意味する。小麦における遺伝子クローニングの現在のコンセンサスは、長いバイオインフォマティクスパイプラインの中で多くのステップを手作業で行うことである。
 ここでは、作物遺伝子クローニングのための完全自動化されたパイプラインであるAutoCloner (www.autocloner.com)を紹介する。AutoClonerは、ユーザーから興味のある配列を受け取り、特定の倍数性の作物ゲノムアセンブリに対して基本的なローカルアラインメント検索ツール(BLAST)検索を実行する。相同な配列は、入力された配列と一緒に、一塩基多型(SNP)のためにマイニングされるマルチプルシークエンスアラインメントにコンパイルされる。次に、関心のある遺伝子全体をカバーする可能性のあるプライマーの様々な組み合わせが作成され、Primer3によって評価される。最も高いスコアを持つプライマーのセット、およびすべてのSNPの位置にある可能性のあるすべてのプライマーは、ポリメラーゼ連鎖反応(PCR)のためにユーザーに返される。現在、ゲノム配列を持たないアポジー小麦品種において、AutoClonerを用いて興味のある様々な遺伝子をクローニングすることに成功した。さらに、小麦ゲノムアセンブリから得られた約80,000の高信頼度遺伝子モデルを用いて、パイプラインを実行することにも成功した。
 AutoClonerは、これまでは手作業で行われていた倍数性の遺伝子クローニングのためのプライマーデザインを完全に自動化した初めてのツールである。AutoClonerのウェブインターフェースは、研究者がソフトウェアをダウンロードしたり、興味のある配列以外の詳細を入力したりする必要がなく、遺伝子クローニングのためのシンプルで効果的な倍数体ゲノムのプライマーデザイン方法を提供する。

 

GIthub

ローカルで実行することもできる。README.md参照。

 

webサービス

http://coultona.cyverseuk.org にアクセスする。

f:id:kazumaxneo:20200727002947p:plain

 

ゲノムを指定する。ここではIWGSC v1.0を指定。

f:id:kazumaxneo:20200727003351p:plain

 

コムギについては、パンコムギのRobigus、Paragon、Claire、Cadenza、デュラムコムギKronosを含む5つの追加品種のデータも指定してSNPs精度を上げることが可能。

f:id:kazumaxneo:20200727003550p:plain

 

遺伝子配列を貼り付ける。fastaのヘッダーがあると動作しない。配列だけ貼り付ける。

f:id:kazumaxneo:20200727004155p:plain



 

Advanced options

f:id:kazumaxneo:20200727004205p:plain

 

実行する。マルチプルシーケンスアラインメントとBLASTの計算には十分前後かかる。

 

出力。

f:id:kazumaxneo:20200727010057p:plain

 

1、Homologues

下のHomologuesではマルチプルシーケンスアラインメントから除く配列を指定できる。ここでは、上のマルチプルシーケンスアラインメントでギャップになっていた配列を除く。

f:id:kazumaxneo:20200727010554p:plain

ゲノムを選択してボタンをクリックする。

 

除かれた。

f:id:kazumaxneo:20200727010917p:plain

 

2、SNPs

プライマーの候補となるSNPについて考える前にアラインメントを調べる。ここでは配列同一性の低い領域をマスキングするオプションが選べる。これは、入力配列と比較して配列同一性が低い領域は有効なプライマーターゲットにはならないが、AutoClonerがどの塩基をSNPとして分類するかに影響を与える可能性があるためである。例えば、下の図1の21番目の位置はSNPのように見えるが、最後の配列のアライメントが悪いため、AutoClonerはそれを検出できない。

f:id:kazumaxneo:20200727011024p:plain

アライメントが良さそうであれば、マスキングのチェックを外したままSNP計算を実行する。

SNP Information

f:id:kazumaxneo:20200727011751p:plain

 

 

3、Primers

プライマーを設計する。

f:id:kazumaxneo:20200727011840p:plain

 

出力

Overview

f:id:kazumaxneo:20200727011958p:plain

 

Primer set1

f:id:kazumaxneo:20200727012013p:plain

 

Sanger Primers

PCR産物の長さが長い場合のサンガーシークエンシングのための追加のプライマー。各産物の600塩基毎に重なり合う前方プライマーが列挙される。

f:id:kazumaxneo:20200727012023p:plain


引用

AutoCloner: automatic homologue-specific primer design for full-gene cloning in polyploids

Alexander Coulton, Keith J. Edwards
BMC Bioinformatics volume 21, Article number: 311 (2020)

 

参考

コムギのゲノムを読む

ゲノム研究はコムギ研究とともに始まった

https://www.jstage.jst.go.jp/article/kagakutoseibutsu/55/2/55_105/_pdf