macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

メタゲノムデータからvirusゲノムを検出するVIP

VIPはメタゲノムデータからホスト由来のコンタミリードを除き、virus由来のリードをアセンブルしてviursを分類・検出するパイプライン。クオリティトリミングからvirusのデータベースにリードをアライメントして照合することまで自動化されており、シンプルなコマンドだけでvirusを検出することが可能になっている。

  

インストール 

md5sumがmacにはないのでインストールしておく。

brew install md5sha1sum
brew install seqtk
brew install oases
brew install rapsearch2

 

本体 Github

https://github.com/keylabivdc/VIP

git clone https://github.com/keylabivdc/VIP
cd VIP/installer/
chmod 755 *
sudo sh dependency_installer.sh
mkdir database
sudo sh db_installer.sh -r database

 

VIPで提供されている幾つかのツールのバイナリがmacでは動作しないので、brewでとってきて置換する(VIP/のルートにあるバイナリ)。

brew install seqtk
brew install oases
brew install rapsearch2

 VIPのrootのバイナリを置き換える。picardについては名前が違うので、VIPが使う名前でリンクを貼っておく(またはVIPのコードを修正)。

ln -s /user/local/bin/picard /user/local/bin/picard-tools

 

 

 

ラン

configファイルの作成

 ./VIP.sh -i input.fastq -f fastq -p illumina -z

 

作成したconifgファイルを指定してラン。

./VIP.sh -c <configfile> -i <NGSfile>

 

 

 

 

引用

VIP: an integrated pipeline for metagenomics of virus identification and discovery

Yang Li, Hao Wang, Kai Nie, Chen Zhang, Yi Zhang, Ji Wang, Peihua Niu & Xuejun Ma

Scientific Reports 6, Article number: 23774 (2016)