macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

アセンブリ配列やゲノムから遺伝子配列をblast検索できるwebツール SimpleSynteny

 

 異なる生物ゲノムの保存されたシンテニーのパターンを理解することは、分子生物学の分野における中心的な事業である。元々synteny(以後シンテニー)は細胞遺伝学によって定義され、単一の染色体上に位置する2つ以上の遺伝子座の存在を言及した(論文より ref.1)。次世代シークエンシングの普及と全ゲノムデータセットアセンブリによって、シンテニーはcollinearity、または遺伝子の順序と向きの保存と交換可能に記述することにも一般的になった。定性的には、シンテニーは、関連するスケールに応じて異なる形態を取ることができる。 マクロシンテニーは、全染色体スケールでの遺伝子順序のcollinearityを意味し、マイクロシンテニーは、所与の染色体サブ領域にわたってcollinearityを示す少数の遺伝子を意味する。mesosynteny は、collinearityなしの染色体での遺伝子保存として特徴付けられる。染色体の再編成、遺伝子のlossesとgains、染色体の重複や消失を含む様々なプロセスによってシンテニーの程度は時間の経過とともに分解されるため、生物学者は生物と遺伝子ファミリーの進化的相違に関する質問に対処することができる。シンテニー探査の焦点は、単一の染色体上の遺伝子に限定され、ゲノム全体の構成を検討するために拡大され、クエスチョン(ref.3)に応じて複数の種間で実施され得る。

 シンテニーを評価するためのコンピュータツールは、比較ゲノム研究、特に多数のコンティグを含むドラフトゲノムアセンブリの増殖のために、ますます重要な構成要素となっている。新規なシンテニー領域を検出するためのプログラムのいくつかの例は、Proteny(ref.4)、i-ADHoRe(ref/5)またはDRIMM-Synteny(ref.6)を含む。追加の予測ソフトウェアツールの最近の要約が(ref.7)に提供されているが、視覚化については(ref.8)で利用可能である。一般に、シンテニーを推定するための各プログラムは、収容されたゲノム数、スコアリングの方法、分析のスケール(マイクロ対マクロシンティック)およびユーザーインターフェースコマンドライン対グラフィカル/ウェブベース)のトレードオフを提供する)。特定のプロジェクトのためのプログラムを選択するとき、密接に関連した分類群を扱うときにはより優れたものがあり、異なる分類群ではより良いものがある(4,7)ことに留意されている。したがって、同じデータセットの結果はプログラム間で大きく異なる可能性がある(ref.9)。

(一段落省略)

 私たち(著者ら)のパイプラインは、あらかじめ選択された遺伝子ターゲットセットを探索する研究者にとってより詳細な視点を提供する。 Yeast Gene Order Browser(ref.13)のような、キュレーションされたゲノムのサブセットのシンテニーを表示する専用のブラウザとは異なり、ユーザーは任意のゲノムから得られたコンティグをアップロードできる。アクセシビリティに重点が置かれているため、高度なコンピュータやスクリプティングスキルのない人にとっても使いやすいツールとなっている。(以下省略)

 

FAQ

https://www.dveltri.com/simplesynteny/faq.html

 

使い方

https://www.dveltri.com/simplesynteny/ にアクセスする。

f:id:kazumaxneo:20181108153537p:plain

 

使用できるファイルには以下のような制限がある。読んでおく。

f:id:kazumaxneo:20181108162753p:plain

 

E.coli K12のゲノム配列からE.coli 0157の遺伝子を探してみる。

step1: まず左のウィンドウに、ゲノムのFASTAファイルをローカルディスクから選択しアップロードする。コード領域のFASTAもあれば、shiftキーを押して両方アップロードする。同様に、クエリとする遺伝子のFASTAファイルもアップロードする。

f:id:kazumaxneo:20181108163145p:plain

 

下の方にスクロールし、先ほどアップロードした配列を改めて選択する。最後に、必要であればblastのパラメータを変更する。Proceed step2ボタンを押す。

f:id:kazumaxneo:20181108162842p:plain

 

step2: 可視化する必要がないクエリヒットがあれば削る。終わったらProceed step3ボタンを押す。

f:id:kazumaxneo:20181108163048p:plain

 

step3: 一番下のgenerate~ボタンを押すことで結果が可視化される。

f:id:kazumaxneo:20181108163057p:plain

 下に表示されているパラメータを変更することで、その場で結果を修正することもできる。 色の濃さはBLAST hitのスコアの高さを表す。

f:id:kazumaxneo:20181109070126p:plain

マニュアルより

 

 

デモラン

デモでは、ゲノムとコード領域のアミノ酸配列fastaを使っている。

step1 ゲノムを選択して、Proceed step2ボタンを押す。

https://www.dveltri.com/simplesynteny/demo.html

f:id:kazumaxneo:20181108154616p:plain

 

結果。

f:id:kazumaxneo:20181108153828p:plain

FLIPとMOVEボタンを押せば表示位置を微調整できる。

 

アセンブリした配列やゲノムなどから、特定の遺伝子や遺伝子クラスターをさっと探したい時に役立ちそうですね。プライマーのような短い配列ではe-valueをあげてもヒットしないので注意して下さい(-task blastn-shortフラグが必要)。Advancedモードでは、より本格的な探索のために、CMAPフォーマットでジョブを投げることができるようになっています。

SimpleSynteny

引用

SimpleSynteny: a web-based tool for visualization of microsynteny across multiple species

Veltri D, Wight MM, Crouch JA
Nucleic Acids Res. 2016