macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

全ゲノムシーケンスしたバクテリア/アーキアのゲノム配列のblastサービス BLAST-XYPlot Viewer

 

 現在、数千の完全にシーケンシングされた細菌および古細菌のゲノムが公開リポジトリで利用可能であり、この数は急速に増加している。この情報は、徹底的な比較ゲノム研究の達成を可能にする。配列類似性を検索するために最も広く使用されているツールの1つは、BLAST(Altschul et al、1990)であり、複数のWebサーバーから、またはスタンドアロンバージョンでローカルに実行できる。 WebサーバーからのBLASTの実行は、少数のクエリシーケンスを同時に比較することに制限されている。 BLASTローカルバージョンを実行する場合、必要な数のクエリシーケンスを含めることができる。それでも、情報を抽出するには追加のプログラミングスキルが必要になる。

 ゲノム情報は、微生物の特性と機能に関する洞察を得るための強力なソースである。大量の固有データを考慮すると、その研究はバイオインフォマティクスツールに依存している。ゲノムマイニングは、シーケンスされたゲノムの特定の生物学的機能をコードする遺伝子または遺伝子のクラスターを見つけるために使用される。これらの遺伝子を検索する最も成功したアプローチの1つは、最も保存された遺伝子/タンパク質または既知の機能を持つ代表的なもののいずれかを、クエリシーケンスとして使用することである。その結果は、研究の特徴に関与する残りの遺伝子を見つけるために、そのゲノムコンテキストをスキャンするための出発点として使用される。そのゲノムコンテキストの特性評価には通常、BLASTまたはシーケンスアラインメントの比較が含まれ、それらの機能が予測される。それでも、この戦略には時間がかかる。あるいは、大規模なBLAST検索を実行すると、それらの遺伝子/タンパク質の複数のヌクレオチドまたはアミノ酸配列をクエリとして含めることができる。バイオインフォマティクスの特性評価にかかる時間を節約するが、分析する必要がある多くのBLAST結果も生成する。

 多くの生物学的プロセスは遺伝子クラスターにエンコードされているため、完全な生合成パスウェイまたは細菌オペロンの存在を判断するには複数の検索が必要になる。これらの検索を1回の実行で実行し、結果を簡単に分析して表示するツールも必要になる。現在、いくつかのツールが利用可能であり、配列類似性によって単一および複数の遺伝子/タンパク質を検索するのに非常に便利である(Fong et al、2008; Revanna et al、2009; Despalins et al、2011; Medema et al、2013; Neumann et al、2014 )。これらのツールには柔軟な構成オプションが含まれているが、表示されるデータの数は限られている。したがって、結果を完全に閲覧するには追加の手順が必要である。したがって、同時に表示できる結果の数は限られている。

 ここでは、プラットフォームに依存しない、無料で自由に使用できるWebツール(http://www.blast-xyplot-viewer.icuap.buap.mxで入手可能)を導入する。このツールを使用して、特定の分類群または生物学的階層、またはすべてのシーケンスされた細菌/古細菌でさえ、単一の実行で単一の遺伝子/タンパク質、オペロンまたは完全な生合成パスウェイの存在、完全性、および分布を検索できる。

 

Tutorial

http://www.blast-xyplot-viewer.icuap.buap.mx/tutorial

 


使い方

http://www.blast-xyplot-viewer.icuap.buap.mxにアクセスする。

f:id:kazumaxneo:20191109232408p:plain

ジョブタイトルをメールアドレスする。また、BLASTのタイプを選ぶ。ここではゲノムを検索する。E.coliゲノムを使った。

f:id:kazumaxneo:20191110022429p:plain

 

データベースを選ぶ。ここでは全バクテリアアーキアを選んだ。

f:id:kazumaxneo:20191110022432p:plain

 

結果

 

f:id:kazumaxneo:20191110004226p:plain

 

XYPlot 

プロットでは、ズーム、ドラッグ、およびマウスオーバーを使用して、数千のBLAST結果の分布全体としてデータを分析したり、特定の結果にズームしたりできる。

f:id:kazumaxneo:20191110024723p:plain

デフォルトのプロットでは、0から360の範囲をカバーするx軸と、検索構成パラメーターで使用されるすべてのレプリコンを含むy軸で全体データが表示される。メインプロットに加えて、特定の範囲でデータをズームできる2つのプロットがある。

 

下と右のグラフは囲むことで指定の領域にジャンプできる。

f:id:kazumaxneo:20191110025053p:plain

 

 

f:id:kazumaxneo:20191113195914p:plain

プロットをスキャンするとき、個々のBLAST結果と遺伝子/タンパク質クラスターを視覚化するには、x軸の20度のウィンドウで十分と記載されている。

引用

BLAST-XYPlot Viewer: A Tool for Performing BLAST in Whole-Genome Sequenced Bacteria/Archaea and Visualize Whole Results Simultaneously

Yagul Pedraza-Pérez, Rodrigo Alberto Cuevas-Vede, Ángel Bernardo Canto-Gómez, Liliana López-Pliego, Rosa María Gutiérrez-Ríos, Ismael Hernández-Lucas, Gustavo Rubín-Linares, Ygnacio Martínez-Laguna, Jesús Francisco López-Olguín, Luis Ernesto Fuentes-Ramírez

G3. 2018 Jul; 8(7): 2167–2172