macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

virusゲノムを同定する GENOME DETECTIVE

 

 Genome Detectiveは、ウイルスのゲノムを迅速かつ正確にアセンブリする使いやすいWebベースのソフトウェアアプリケーションである。提出された入力シーケンスデータ内のすべてのウイルス種について、真核生物ウイルスおよびファージからの配列に分類学的名称を割り当てる。ウイルスが同定された後(いくつかの例外を除いて、種レベルで)、同定されたウイルスは、系統発生サブタイプツールを用いてさらに分析することができる。割り当てられる分類学上のランクは、RefSeqのリファレンスゲノム利用可能性に基づいており、ほとんどが種レベルである。現時点では、6692個のリファレンス配列に基づいて異なる分類学名が割り当てられている。サブタイプを特定するツールは、現在、14種類のウイルスで利用できる。

 このアプリケーションは、アミノ酸ヌクレオチドのスコアを組み合わせ新規のコンティグをリファレンスベースで連結し、ゲノムを構築する新規のアライメント方法を使用する。この割り当ては、ヌクレオチドアミノ酸配列の類似性を同時に最適化するアライメントを計算することによって、RefSeqの注釈付き完全ゲノムとの類似性に基づく。

 

fastqは、最初にデノボアセンブリパイプラインで処理される。具体的にはtrimmomaticを使用して前処理し、DIAMONDおよびUniRef90データベースを使用してリードをフィルタし、タンパク質レベルでソートされ、その後SPADesアセンブラを使用してアセンブルされる。その後、GENOME DETECTIVEは、ウイルス特定のために、アセンブルされたコンティグからコンセンサス配列を生成する。

 

GENOME DETECTIVEに関するツイート。

 

使い方

https://www.genomedetective.com

f:id:kazumaxneo:20180819190320p:plain

 

fastq、またはfastaを指定する。

https://www.genomedetective.com/app/typingtool/virus/

f:id:kazumaxneo:20180819190440p:plain

fastqをドラッグ&ドロップするか、SRAファイルのURLを指定する。

f:id:kazumaxneo:20180819193539p:plain

 

上のタブから利用できるexample data(メタゲノムデータセット)でランしてみる。

> 出力。

f:id:kazumaxneo:20180819191154p:plain

 

virus名をクリックすると詳細を表示できる。

f:id:kazumaxneo:20180819191254p:plain

マッチした領域が緑になっている。マウスでドラッグすることでリファレンスとのアライメントを比較できるようになっている。

 

もう1つのテストデータ解析結果

https://www.genomedetective.com/app/typingtool/virus/job/example-Norovirus_amplicon

 

引用

Genome Detective: An Automated System for Virus Identification from High-throughput sequencing data

Michael Vilsker Yumna Moosa Sam Nooij Vagner Fonseca Yoika Ghysens Korneel Dumon Raf Pauwels Luiz Carlos Alcantara Ewout Vanden Eynden Anne-Mieke Vandamme Koen Deforche Tulio de Oliveira

Bioinformatics, bty695, Published: 16 August 2018