macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

SVDetect

 

 ゲノムの構造変異の同定は、ヒトの遺伝的多様性、進化、ならびに病因を理解する重要なステップである。癌を含む数多くの遺伝病は、構造変異(SV; Futreal et al、2004)と関連している。アレイベースの技術は、SVを検出するための多くの研究において成功しているが、ブレークポイントの検出における比較的低い分解能および小さなSVの特徴付けは依然として困難である。イルミナゲノムアナライザーやApplied Biosystems SOLiDシステムなどのハイスループットシーケンシング技術が導入され、ショートインサートペアエンドまたはメイトペアリードを使用することによりSVの検出能が改善された(Korbel et al、2007)。リファレンスゲノムへのマッピングの際に、ペアの順序、向きおよびインサートサイズなどの情報を利用した異常なマッピングペアを調べることで、潜在的なゲノム変動を示すことができる。

 ここでは、SV検出とペアエンドデータ(ショートとロング)からのSV予測のため利用可能なプログラムSVDetectを提示する。 SVDetectは、異なるタイプのSVを識別する。大規模な挿入 - 欠失と反転、クラスタリングとスライディングウィンドウの両方の戦略で、それらをゲノム規模で視覚化するのに役立る。他のツールと比較して、本発明の方法の新規性は、(i)ペアエンドおよびメイトペア配列データの両方を分析すること、 (ii)SV検出を改善するためにユニークなペアエンド制約を使用する。 (iii)様々なタイプのタンデムduplicationを予測し、再編成を区別する。 (iv)複数のサンプルにわたってSVを比較する; (v)コピー数プロファイルを構築する。 (vi)SVのグラフィカルビューに対する様々な出力ファイルフォーマットを作成する。

 

インストール

依存

  • Perl 5.8.x, or newer
  • Config::General
  • Tie::IxHash
  • Parallel::ForkManager
  • SAMtools
  • BEDTools
  • Circos
cpanm Config::General Tie::IxHash Parallel::ForkManager #libにも入ってる

または

perl -MCPAN -e shell

% install Config::General

 circos、SAMtools、BEDtoolsはbrewで導入できる。

 

本体 SourceForge

https://sourceforge.net/projects/svdetect/?source=typ_redirect

osx用の実行ファイルが含まれているので、ダウンロードして解凍する。

cd /SVDetect_r0.8b/bin/
./SVDetect

r$ ./SVDetect 

Usage:

    SVDetect <command> -conf <configuration_file> [-help] [-man]

 

        Command:

 

            linking         detection and isolation of links

            filtering       filtering of links according different parameters

            links2circos    links conversion to circos format

            links2bed       paired-ends of links converted to bed format (UCSC)

            links2compare   compare and get common/specific links between samples

            links2SV        formatted output to show most significant SVs

            cnv             calculate copy-number profiles

            ratio2circos    ratio conversion to circos density format

            ratio2bedgraph  ratio conversion to bedGraph density format (UCSC)

パスの通ったディレクトリに移動しておく。

 

またはdockerで動かす。

docker pull omicsnut/svdetect

#ここでは共有ディレクトリ~/dataをコンテナの/homeと共有指定して起動する。
docker run -i -t -v ~/data/:/home omicsnut/svdetect
SVDetect #テスト

#抜けるには"control + PQ"。起動しているか確認は"docker ps -a"。
#、再度ログインするには"docker attach <CONTAINER ID>"

 

ラン

テストデータを解析してみる。

cd test_sample/Neuroblastoma/
wget https://sourceforge.net/projects/svdetect/files/Data/Neuroblastoma_supp_data.tar.gz/download
tar -zxvf download
mv Neuroblastoma_supp_data/* .

./svdetect_script.sh

以下のようなシェルスクリプトになっている。

f:id:kazumaxneo:20180503114848j:plain

テストランすると、 docker環境では

error Can't locate SVG.pm in @INC

が最後に出る。CPANからSVG(v2.28)を入れると今度はcircos configurationのエラーが出てしまった。

SVdetectはランの各ステップにconfigurationファイルを使うが、作成手順のマニュアルが見つからなかった。詳細がわかれば追記します。

 

引用 

SVDetect: a tool to identify genomic structural variations from paired-end and mate-pair sequencing data.

Zeitouni B, Boeva V, Janoueix-Lerosey I, Loeillet S, Legoix-né P, Nicolas A, Delattre O, Barillot E.

Bioinformatics. 2010 Aug 1;26(15):1895-6.