Genome Detectiveは、ウイルスのゲノムを迅速かつ正確にアセンブリする使いやすいWebベースのソフトウェアアプリケーションである。提出された入力シーケンスデータ内のすべてのウイルス種について、真核生物ウイルスおよびファージからの配列に分類学的名称を割り当てる。ウイルスが同定された後(いくつかの例外を除いて、種レベルで)、同定されたウイルスは、系統発生サブタイプツールを用いてさらに分析することができる。割り当てられる分類学上のランクは、RefSeqのリファレンスゲノム利用可能性に基づいており、ほとんどが種レベルである。現時点では、6692個のリファレンス配列に基づいて異なる分類学名が割り当てられている。サブタイプを特定するツールは、現在、14種類のウイルスで利用できる。
このアプリケーションは、アミノ酸とヌクレオチドのスコアを組み合わせ新規のコンティグをリファレンスベースで連結し、ゲノムを構築する新規のアライメント方法を使用する。この割り当ては、ヌクレオチドとアミノ酸配列の類似性を同時に最適化するアライメントを計算することによって、RefSeqの注釈付き完全ゲノムとの類似性に基づく。
fastqは、最初にデノボアセンブリパイプラインで処理される。具体的にはtrimmomaticを使用して前処理し、DIAMONDおよびUniRef90データベースを使用してリードをフィルタし、タンパク質レベルでソートされ、その後SPADesアセンブラを使用してアセンブルされる。その後、GENOME DETECTIVEは、ウイルス特定のために、アセンブルされたコンティグからコンセンサス配列を生成する。
GENOME DETECTIVEに関するツイート。
使い方
https://www.genomedetective.com
fastq、またはfastaを指定する。
https://www.genomedetective.com/app/typingtool/virus/
fastqをドラッグ&ドロップするか、SRAファイルのURLを指定する。
上のタブから利用できるexample data(メタゲノムデータセット)でランしてみる。
> 出力。
virus名をクリックすると詳細を表示できる。
マッチした領域が緑になっている。マウスでドラッグすることでリファレンスとのアライメントを比較できるようになっている。
もう1つのテストデータ解析結果
https://www.genomedetective.com/app/typingtool/virus/job/example-Norovirus_amplicon
引用
Genome Detective: An Automated System for Virus Identification from High-throughput sequencing data
Michael Vilsker Yumna Moosa Sam Nooij Vagner Fonseca Yoika Ghysens Korneel Dumon Raf Pauwels Luiz Carlos Alcantara Ewout Vanden Eynden Anne-Mieke Vandamme Koen Deforche Tulio de Oliveira
Bioinformatics, bty695, Published: 16 August 2018