macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Viral populations分析パイプライン Vipie

 

 臨床試料中の全ウイルス量を研究し、急性および慢性感染時のウイルスquasispeciesの進化を評価する要求が高まっているため、Viromeメタゲノミクス研究分野は急速に増加している。Virome sequencing 技術の応用は、感染症研究だけでなく、主として非感染性条件、すなわち病気のリスクを改変すると推定される病気の関連研究においても有用となる。これらのアプリケーションでは、バクテリアのプロファイリングで長年利用されてきたものと同様に、ウイルス量を近似する必要がある。

 ウィルスには共通の配列シグネチャーがないため、ランダムウィルスライブラリーのメタゲノムシーケンシングは、Virome全体の不偏評価の唯一の実現可能な方法である。一連のサンプルにわたりウイルス集団メトリックの正確な定量および解釈する必要性から、この種のメタゲノミクス研究のための実質的な課題が作り出されている。ウィルス研究者の主な障害は大きなgenetic heterogeneityであり、また、大多数のバイオインフォマティクスツールはコマンドラインベースであり、計算上要求が厳しく、複雑な依存関係を持ち、容易に解釈できないテキストベースの出力を生成することも障害になっている[論文より ref.1,2,3, 4,5]。最近リリースされたWebベースのアプリケーションTaxonomer [ref.6](紹介)、VirusTAP [ref.7]、Virome [ref.8]、およびMetavir [ref.9,10]は、問題のいくつか(特にユーザインタラクション関連)に対処したが、主にシングルサンプルのみで動作し、ワークフローのローカル依存関係とインストールが必要になる。ViromeScan [ref.11](紹介)とMetaShot [ref.12]は、複数のサンプルで動作する。(一部略)論文表1にこれらさまざまなツールの主な機能と戦略の概要を示す。

 ここでは、複数サンプルのviromeメタゲノミクスNGS解析からのファイルセットを入力として受け入れる、Webベースのウイルスのpopulations多様性分析ツールであるVipieを紹介する。Human Microbiome Projectや他のメタゲノミクス研究のNGSサンプルを使用したワークフローと結果を評価する。Vipieは主要なブラウザすべてで機能し、高性能のパイプラインは学術的利用のために自由に使用できる。

 本パイプラインは、メタゲノミクスシーケンシングの最も典型的なde-multiplexedされたペアエンドFASTQファイルを処理する。 Genbankから派生したローカルカスタムウイルスデータベースに対してBlastを実行することにより、クオリティ管理(QC)、推定ゲノムコンティグのde novoアセンブリ、コンティグのtaxonomic classificationを行う。最後にこのtaxonomic classificationによって同定されたリファレンス配列にリードを再マッピングする。デフォルトの分析パラメータは容易に変更することができる。個々のパラメータとそのデフォルト値は、ユーザガイドに記載されている。

 

f:id:kazumaxneo:20181006172728p:plain

Vipieワークフロー。マニュアルより。

 

マニュアル

https://binf.uta.fi/vipie/doc/vipie_user_guide.pdf

 

使い方

 1、https://binf.uta.fi/vipie/  にアクセスしてログインする。初回はユーザー登録が必要。

f:id:kazumaxneo:20180825193701p:plain

2、ファイルをアップロードする(FASTQ gz/zip (*Requires paired X.R1.fastq/X.R2.fastq or X_R1.fastq/X_R2.fastq files))。

f:id:kazumaxneo:20180827121249j:plain

 

 

デモラン結果

f:id:kazumaxneo:20181006172618p:plain

f:id:kazumaxneo:20181006172610p:plain

f:id:kazumaxneo:20181006172614p:plain

 

f:id:kazumaxneo:20181006172623p:plain

 

 

テスト時は、何度か チャレンジしたが、ジョブを投げることができなかった。改善できたら追記します。

 

引用
Vipie: web pipeline for parallel characterization of viral populations from multiple NGS samples
Lin J, Kramna L, Autio R, Hyöty H, Nykter M, Cinek O

BMC Genomics. 2017 May 15;18(1):378