2023/07/12 追記
ウイルス性因子データベース(VFDB、http://www.mgc.ac.cn/VFs/)は、細菌の病原性を解読するための包括的なアーカイブとオンラインプラットフォームを研究者に提供することに専念している。ウイルス性因子(VF)の様々な組み合わせ、組織、および発現は、病原体感染の多様な臨床症状の原因となっている。現在、全ゲノムシークエンシングは、新興のアウトブレイクにおいても、ルーチンの臨床現場においても、潜在的な新規病原菌または変異病原菌を解読するために広く利用されている。しかし、病原体組成の効率的な特徴付けは、バイオインフォマティクスのスキルが限られている微生物学者や医師にとっては、依然として課題となっている。そこで、我々はVFDBに統合された自動パイプラインであるVFanalyzerを導入し、細菌ゲノムの全塩基配列から既知/潜在的なVFを系統的に同定することに成功した。VFanalyzerは、まず、問い合わせゲノム内に直交グループを構築し、VFDBからリファレンスゲノムを事前に解析して、パラログによる偽陽性の可能性を回避する。次に、VFDBの階層化されたデータセットの中から反復的かつ網羅的な配列類似度検索を行い、非典型的/系統特異的なVFの可能性を正確に特定する。また、遺伝子クラスターでコード化されたVFに対しては、コンテキストベースのデータ精緻化処理を行うことで、人手によるキュレーションを必要とせず、比較的高い特異性と感度を実現している。また、VFanalyzerのレポートを比較病理学的なスタイルで表示し、オンラインでの解析を容易にするために、徹底的に最適化されたインタラクティブなWebインターフェースを導入している。
http://www.mgc.ac.cn/VFs/main.htm
VFanalyzerをクリックするとVFanalyzerのトップページにジャンプする。
VFanalyzer
http://www.mgc.ac.cn/cgi-bin/VFs/v5/main.cgi?func=VFanalyzer
ここではコレラ菌のゲノムのchr1のgenbankファイルを使ってみる。ローカルのゲノムリスト、または有効なGenBankアクセッションから解析を行うことができる。
VFanalyzerは、与えられた完全/ドラフト細菌ゲノム中の既知/潜在的VFを系統的にスクリーニングする。生のFASTAゲノムを用いたクエリの場合、予測CDSはVFanalyzerの実行前にGLIMMER3を用いて同定される。なお、VFanalyzerは、VFDBに完全な情報が登録されている細菌病原体属のクエリーゲノムのみを受け付け、完全またはほぼ完全なドラフトゲノムを対象としている。そのため、クエリーゲノムが他の細菌由来であったり、部分的にしか配列が決定されていない場合は、信頼性が低下する。
引用
VFDB 2019: a comparative pathogenomic platform with an interactive web interface
Bo Liu, Dandan Zheng, Qi Jin, Lihong Chen, Jian Yang
Nucleic Acids Research, Volume 47, Issue D1, 08 January 2019