macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ウィルス専用の遺伝子予測webツール Vgas

 2019 10/22 タイトル修正

 

 ウイルス感染によって引き起こされるヒト感染症の治療のためのウイルスゲノム研究の途方もない価値のために、Webサーバーやデータベースを含む多くのウイルス情報学リソースが開発された(Sharma et al、2015)。 RefSeqデータベースに保存されるウイルスゲノムの数は、シークエンシング技術の急速な発展に伴い、2000年から2016年にかけて5倍以上に増加している(Brister et al、2015)。ウイルスゲノムの調査において、最初の最も重要なステップは、遺伝子に正確にアノテーションを付けることである。ウェット実験はウイルス遺伝子にアノテーションを付ける最も正確な方法である可能性が高いが、実験には時間がかかり、そのような膨大なデータを処理するために莫大な費用がかかる。さらに、ウェット実験では、特定の条件でのみ発現されるいくつかの遺伝子を見逃す場合があるが、実験技術には限界がある。したがって、実験結果の支援および参照手段として機能するには、ウイルス遺伝子予測の計算方法が必要である。現在、比較的正確なウイルス遺伝子予測を達成するための計算方法には、類似性ベースの方法とab initioの方法の2つの主要なグループがある。 Z曲線は、遺伝子同定に広く適用される理論の一種である(Dong et al、2016, pubmed; Guo et al、2017)。 Z曲線法に基づいて、本著者らはZCURVE_Vを2006年に開発した。これは、ウイルスのab initio遺伝子発見ソフトウェアプログラムで、過去数年間で多くの研究者がウイルス遺伝子を研究するのに役立った(Li et al、2013; Huang et al、 2014; Mahony et al、2015; Harrison et al、2016)。

 現在の作業では、ZCURVE_V(Guo and Zhang、2006)に基づいてシステムを更新し、分類モデルの識別変数を増やし、遺伝子予測のためのBLASTp検索モジュールを追加した。これらの2つの変更により、新しく提案されたVgasシステムは、ZCURVE_Vよりも高い予測精度を達成しただけでなく、公共データベースの既知の機能を持つ遺伝子のホモログである予測遺伝子のfunctional遺伝子アノテーションも提供した。 Vgasのアプリケーション例として、86の新規遺伝子が見つかり、RefSeqアノテーションでは見逃されていたが、明示的な機能が割り当てられた。 Vgasは、研究者が未知のウイルスゲノムを効率的に分析するのに役立つと考えている。

 

FAQ

http://cefg.uestc.cn/vgas/FAQ.php

オープンソースではないためソースコードは公開されていない。

 

手順は論文のThe Implementation Process of Vgasを読んで下さい。

 

使い方

http://cefg.uestc.cn/vgas/にアクセスする。

f:id:kazumaxneo:20191022004240p:plain

 

ウィルス配列を入力する。

f:id:kazumaxneo:20191022114452p:plain

 

任意で他の パラメータを指定する。ここではOutput optionsのFASTA形式の遺伝子配列とアミノ酸配列も指定した。

f:id:kazumaxneo:20191022114603p:plain



出力。リンクをクリックすると結果が表示される。

f:id:kazumaxneo:20191022114835p:plain

 

 

引用

Vgas: A Viral Genome Annotation System

Kai-Yue Zhang, Yi-Zhou Gao, Meng-Ze Du, Shuo Liu, Chuan Dong,  Feng-Biao Guo

Front Microbiol. 2019; 10: 184