パンゲノムアプローチは細菌の比較ゲノム解析や進化解析に多く用いられているが、バイオインフォマティシャンのいない生物学者にはまだ難しいため、細菌パンゲノムの探索を容易にする革新的なツールが必要である。PanExplorerは、様々なゲノム解析とレポートを提供するウェブアプリケーションであり、直感的な表示により、バクテリア・パンゲノムの理解を深めることができる。一例として、Anaplasmataceae 121株(Ehrlichia 30株、Anaplasma 15株、Wolbachia 68株を含む)のパンゲノムを作成した。
PanExplorerはPerl CGIで書かれており、可視化のためにいくつかのJavaScriptライブラリ(hotmap.js, MauveViewer, CircosJS)に依存している。PanExplorerはhttp://panexplorer.southgreen.fr で自由に利用できる。ソースコードはGitHubリポジトリ(https://github.com/SouthGreenPlatform/PanExplorer)で公開されている。PanExplorerのウェブサイトには、ドキュメントのセクションが用意されている。
Documents
https://panexplorer.southgreen.fr/cgi-bin/doc.cgi?project=Anaplasmataceae
(Githubより)
PanExplorer は、PGAP または Roary を用いてパンゲノム解析を行い、得られた情報を、遺伝子クラスターの探索やデータの解釈を容易にするいくつかのモジュールを通して、包括的かつ容易にするものです。このアプリケーションでは、様々なレベルでインタラクティブにデータを探索できます。
(i) 存在/非存在のヒートマップとしてパンゲノムを可視化する。コア遺伝子(全株に存在)、クラウド遺伝子(アクセサリーゲノム由来の遺伝子)、ゲノム特異的遺伝子を容易に同定、区別できる。
(ii) コア遺伝子と株特異的遺伝子の物理マップは、各ゲノムごとに独立した円形のゲノム表示(Circos)として表示できる。
(iii) シンテニー解析。ゲノム間の遺伝子順序の保存性をグラフ表示で調べることができる。
(iv) 特定のクラスターを目視で確認する。
https://panexplorer.southgreen.fr/cgi-bin/home.cgiにアクセスする。
import genomeをクリックする。
プロジェクト名、ゲノムのAccession ID(GenBankかRefSeqのID)、メールアドレスを指定する。
パンゲノム解析ツールを指定する。
Minimum identityを指定する。
Check GenBank IDsをクリックするとIDがチェックされる。
問題なければSubmitボタンがアクティブになる。Submitをクリック。
解析にはある程度時間がかかる。
出力例
Overviewと、追加で実行できる二次解析のタブに分かれている。
Overview
Pan-genome
Core-genome
Strain-Specific Genes
COGs
Searchタブ
ゲノムを選択し、そのサブセットのコアとなる遺伝子を表示する。
Syntenyタブ
クラスターをハイライト表示する。3つゲノムを選択する。
(説明より)3つのゲノム上のコア遺伝子の物理的な位置を表し、ゲノム間の遺伝子順序の保存性を評価できる。各ノードは、3つのゲノム間でコア遺伝子として定義されたクラスタに対応している。リンクは、ゲノムのリアレンズメントを推定しやすくするために、カラーグラデーションで色付けされている。マウスカーソルをノードに乗せると、クラスタの名前と対応する系統ゲノムの遺伝子が表示される(Hive Plotについて、Datavizの解説)。
Mauve Viewer
Cluster searchタブ
遺伝子名またはクラスター名を入力する。
クラスターに含まれる遺伝子数が400以下であれば系統を再構築できる。
ハプロタイプの配列数が75以下であれば、ネットワークを構築できる。
ハプロタイプ配列(SNP位置のみ)のMedian-Joining Network (MJN)
Gene Searchタブ
Searchタブはゲノムだが、Gene Searchタブでは遺伝子を検索できる。
Circosタブ
TOPページからデモとして3つのプロジェクトの結果を閲覧できます。アクセスしてみて下さい。
引用
PanExplorer: a web-based tool for exploratory analysis and visualization of bacterial pan-genomes
Alexis Dereeper, Marilyne Summo, Damien F Meyer
Bioinformatics, Published: 02 August 2022
関連