macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

In vitro合成用にゲノムを分割する Genome Partitioner

 

 40年以上前に制限エンドヌクレアーゼが発見されて初めて使用されて以来、DNAを単一および複数のコンストラクトに組み立てる能力が分子生物学を推進してきた[論文より ref.1]。過去10年間で、合成生物学の分野を形作り、ゲノム規模の生物学的オペレーティングシステムのサイズまで新しい生物学的部品およびモジュールの設計および構築を可能にするいくつかの技術的改善が見られた[ref.2]。まず第一に、これは低コストで高忠実度のDNA合成技術の急速な進歩によって可能になった[ref.3]。現在、遺伝子合成の商業サービスは、多数の会社からシーケンス確認済みの最大4kbサイズのコンストラクトが提供されている(論文執筆時点)。さらに、BioBricks [ref.4]、Golden Gate Cloning [ref.5]、BASIC [ref.6]などの多くの設計スタンダードが、DNAの部分配列をより高次のコンストラクトにモジュール式に組み立てるアシストに設計されてきた[ref.7,8]。最近になって、等温アセンブリおよび in vivo組換え技術により、古典的な制限/連結方法による大きなDNAフラグメントアセンブリを取り巻く多くのボトルネックが取り除かれた。このようなオーバーラップベースの組み立て方法は、一段階の工程で5つ以上のDNAパーツを容易に組み立てることができる[ref.9]。それにより、in vitro等温アセンブリ法[ref.10]による短い重複配列の結合、または直鎖状DNAのSaccharomyces cerevisiaeへの形質転換による相同組換えDNA修復機構によって、小さなDNA断片が端から端まで連結される[ref.11、12]。

 homologous end joining の方法が単純であっても、kbの塩基からMbの塩基の合成および構築プロセスをナビゲートすることは、依然としてほとんどの実験室にとって制限要因である。すべてのDNA配列が低コストのde novo DNA合成を介してアクセス可能であるとは限らず、製造業者が製造が困難な配列を拒絶する可能性がある。 DNA合成および構築の効率を低下させる好ましくない配列の特徴には、二次構造および極端なGC含量が上昇による配列ストレッチが含まれる。したがって、より大きなDNA設計には、合成前に、コンピュータ計算アルゴリズムによるシーケンスリファクタリングを必要とする[ref.13、14](プログラムのリファクタリングwiki)。

 Partitioning(以後、分割)プロセスは、単にDNAを一連の短いフラグメントに分割するよりも複雑である。組み立てプロセスをガイドする追加のシーケンスを、分割されたフラグメントの両端に入れ子にして挿入する必要がある。これらは隣接フラグメント間の相同性領域、増殖ベクターへのクローニングに必要な特定のアダプター配列およびその後のフラグメントの放出のためのIIS型制限部位を含む。さらに、これらの特徴は隣接するアセンブリフラグメントの一本鎖アニーリングと競合し、アセンブリ反応中の収率を低下させるので、相同領域はDNA二次構造を含むべきではない。 DNA設計が大きくなればなるほど、隣接するDNAブロック間の相同性領域の最適化はより重要になる。分割プロセスは、複雑なゲノム規模のDNAデザインの合成と組み立てを最適化するための逆合成(retrosynthetic )技術と見なすことができる。その複雑さを考えると、DNA設計の手動配列分割は実行可能ではない。したがって、生物学的システムの合理化されたアセンブリへの道を切り開くためには、大きなDNA配列をより小さく、加工可能なDNAブロックに断片化するコンピュータ支援設計ツールが必要である。これらの必要性に取り組むために、著者らは合成生物学応用のための大規模DNAコンストラクトのマルチレベル分割を可能にするウェブ - ツールインターフェース、Genome Partitionerソフトウェアを開発した。

 このアルゴリズムは、Pythonで実装されており、GenBankファイルをパースするためのBiopythonパッケージ[ref.15]と、グラフィック出力生成のためBiopythonのBio GraphicsパッケージのGenomeDiagramプロットルーチン[ref.16]を使用する。 Genome Partitioner Webツールは、パーティションパラメータ、サポートされているパーティションモード、ログファイル、シーケンス出力ファイル、および統計ファイルの説明など、詳細なオンラインドキュメントを提供する。

 このアルゴリズムは最大4つのアセンブリ層を生成する(論文図1)。最も低いアセンブリ層では、Genome PartitionerがFASTAフォーマットで1 kbのサブブロック配列を生成し、de novo DNA合成によって化学合成される。オーバーラップベースのDNAアセンブリ法を使用して、これらのサブブロックを中間の4kb DNAアセンブリユニット(ブロックと呼ばれる)に結合し、それをさらに20kb DNAアセンブリユニット(セグメントと呼ばれる)に組み立てる。最高の組立段階では、DNAセグメントは望ましいゲノムスケールのDNAコンストラクトに組み立てられる。

 

f:id:kazumaxneo:20190201231516p:plain

Flowchart illustrating the design-to-build workflow for the streamlined assembly of genome-scale DNA constructs. 論文より転載。

 

使い方

https://christenlab.ethz.ch/GenomePartitioner/upload_form_v6.phpにアクセスする。

f:id:kazumaxneo:20190201230629p:plain

ここではテストファイルを使う。Use Test fileをクリック。

 

分割パラメータセッティングに進む。分割サイズ、オーバーラップサイズ、ベクターへの組み込みと切り出し用の制限酵素認識部位付きプライマー配列、などを指定する。

f:id:kazumaxneo:20190201231727p:plain

primerにチェックも入れる。Submitをクリック。

 

入力のgenebankのfasta、分割後のブロック配列fasta、サブブロック配列fasta、さらにプライマー配列がダウンロードできる。

f:id:kazumaxneo:20190201231759p:plain

Fi

引用
Genome Partitioner: A web tool for multi-level partitioning of large-scale DNA constructs for synthetic biology applications

Christen M, Del Medico L, Christen H, Christen B

PLoS One. 2017 May 22;12(5):e0177234