ゲノムの構造変異の同定は、ヒトの遺伝的多様性、進化、ならびに病因を理解する重要なステップである。癌を含む数多くの遺伝病は、構造変異(SV; Futreal et al、2004)と関連している。アレイベースの技術は、SVを検出するための多くの研究において成功しているが、ブレークポイントの検出における比較的低い分解能および小さなSVの特徴付けは依然として困難である。イルミナゲノムアナライザーやApplied Biosystems SOLiDシステムなどのハイスループットシーケンシング技術が導入され、ショートインサートペアエンドまたはメイトペアリードを使用することによりSVの検出能が改善された(Korbel et al、2007)。リファレンスゲノムへのマッピングの際に、ペアの順序、向きおよびインサートサイズなどの情報を利用した異常なマッピングペアを調べることで、潜在的なゲノム変動を示すことができる。
ここでは、SV検出とペアエンドデータ(ショートとロング)からのSV予測のため利用可能なプログラムSVDetectを提示する。 SVDetectは、異なるタイプのSVを識別する。クラスタリングとスライディングウィンドウの両方の戦略で、大規模な挿入 - 欠失と逆位をゲノム規模で視覚化する。他のツールと比較して、本発明の方法の新規性は、(i)ペアエンドおよびメイトペア配列データの両方を分析すること、 (ii)SV検出を改善するためにユニークなペアエンド制約を使用する。 (iii)様々なタイプのタンデムduplicationを予測し、再編成を区別する。 (iv)複数のサンプルにわたってSVを比較する; (v)コピー数プロファイルを構築する。 (vi)SVのグラフィカルビューに対する様々な出力ファイルフォーマットを作成する。
インストール
依存
- Perl 5.8.x, or newer
- Config::General
- Tie::IxHash
- Parallel::ForkManager
- SAMtools
- BEDTools
- Circos
cpanm Config::General Tie::IxHash Parallel::ForkManager #libにも入ってる
または
perl -MCPAN -e shell
% install Config::General
circos、SAMtools、BEDtoolsはbrewで導入できる。
本体 SourceForge
https://sourceforge.net/projects/svdetect/?source=typ_redirect
osx用の実行ファイルが含まれているので、ダウンロードして解凍する。
cd /SVDetect_r0.8b/bin/
./SVDetect
r$ ./SVDetect
Usage:
SVDetect <command> -conf <configuration_file> [-help] [-man]
Command:
linking detection and isolation of links
filtering filtering of links according different parameters
links2circos links conversion to circos format
links2bed paired-ends of links converted to bed format (UCSC)
links2compare compare and get common/specific links between samples
links2SV formatted output to show most significant SVs
cnv calculate copy-number profiles
ratio2circos ratio conversion to circos density format
ratio2bedgraph ratio conversion to bedGraph density format (UCSC)
パスの通ったディレクトリに移動しておく。
またはdockerで動かす。
docker pull omicsnut/svdetect
#ここでは共有ディレクトリ~/dataをコンテナの/homeと共有指定して起動する。
docker run -i -t -v ~/data/:/home omicsnut/svdetect
SVDetect #テスト
#抜けるには"control + P、Q"。起動しているか確認は"docker ps -a"。
#、再度ログインするには"docker attach <CONTAINER ID>"
ラン
テストデータを解析してみる。
cd test_sample/Neuroblastoma/
wget https://sourceforge.net/projects/svdetect/files/Data/Neuroblastoma_supp_data.tar.gz/download
tar -zxvf download
mv Neuroblastoma_supp_data/* .
./svdetect_script.sh
以下のようなシェルスクリプトになっている。
テストランすると、 docker環境では
error Can't locate SVG.pm in @INC
が最後に出る。CPANからSVG(v2.28)を入れると今度はcircos configurationのエラーが出てしまった。
SVdetectはランの各ステップにconfigurationファイルを使うが、作成手順のマニュアルが見つからなかった。詳細がわかれば追記します。
引用
SVDetect: a tool to identify genomic structural variations from paired-end and mate-pair sequencing data.
Zeitouni B, Boeva V, Janoueix-Lerosey I, Loeillet S, Legoix-né P, Nicolas A, Delattre O, Barillot E.
Bioinformatics. 2010 Aug 1;26(15):1895-6.