ウイルス感染は、様々なヒト悪性腫瘍の共通の危険因子である。例えばB型肝炎ウイルス(HBV)は、感染時にヒトゲノムに組み込まれ、発癌にかかりやすい遺伝子機能の破壊をもたらすことがある。過去には、PCRに基づきウィルスを検出していたが、制限が多かった。この障害は、近年のNGSの進歩により解決されたが依然として未解決の制限がある。たとえば、VirusSeq [論文より ref.2]は、正確なウイルスのブレークポイント位置を検出できず、ViralFusionSeq [ref.3]とVirusFinder [ref.4,5]は、複雑なインストール手順と長いランタイムを必要とする。
Virus-Clipは、ソフトクリップされたリードからウイルスが組み込まれたブレークポイントの正確な位置を特定する。さらにannovarと連携して影響を受けたヒト遺伝子に自動的に注釈を付けることもできる。 最小限のステップと簡素化された手順により、実行パフォーマンスは既存のツールと比較して大幅に向上し、高速でメモリ効率が高いとされる。Virus-Clipはトランスクリプトームデータを用いて検証され、その検出は満足できる感度および特異性を有することが確認された。
インストール
依存
- SAMTools
- BWA
- BLAST+
- ANNOVAR(ダウンロードリンク)
本体は下記からダウンロードする。wordマニュアルも同封されている。
http://web.hku.hk/~dwhho/Virus-Clip.zip
virus_clip.shを開いて各ツールの場所とデータベース場所を指定しておく必要がある。私の場合は、whichコマンドで調べ(e.g., which samtools)、以下のように設定した。データベースの場所は後で設定する。
ラン
テストデータとしてVirusFinder 2 で使用されているWhole genome sequencing of HBV-positive hepatocellular carcinoma (HCC) samples(リンク)を使用した。
indexの準備
bwa index HBV.fasta
humanのblastデータベースの作成
makeblastdb -in human.fa -dbtype nucl -out human
mkdir virus_clip
mkdir virus_clip/align #read alignmentの保存場所
mkdir virus_clip/result #viral integration detection resultの保存場所
データベースの場所をvirus_clip.shに記載する。以下のようにした。
ペアエンドのfastq.gzをVirus-Clip/sequenceに置いてある。ペアエンドのランは以下のように実行する(シングルエンドなら最後は1)。
bash virus_clip.sh /Users/user/Downloads/Virus-Clip/sequence/Users/user/Downloads/Virus-Clip/virus_clip/ output 2
引用
Virus-Clip: a fast and memory-efficient viral integration site detection tool at single-base resolution with annotation capability
Daniel WH Ho, Karen MF Sze, and Irene OL Ng
Oncotarget. 2015 Aug 28; 6(25): 20959–20963.