macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

small indelとSNV検出のワークフロー 準備編

 この投稿はSNVとindel検出に必要なツールの準備編です。 実際の検出のワークフローは以下のエントリーを確認してください。


 

--準備するもの--

解析に必要なソフト

GATK

BWA

Picard

Samtools

Bedtools

SnpEff

R (解析の途中で読み込まれ画像ファイルなどを出力することなどに使われる)。10.11以降はターミナルから読み出せる。

 

brewコマンドを使うことで、ワンライナーでインストールできる。

brew tap homebrew/science #scienceをオフィシャルコマンド群にする儀式

以下はツールがない人だけ実行する。(すでにインストールされているとエラーになるのでとりあえず実行しても良い)

brew install samtools
brew install bwa
brew install gatk
brew install picard
brew install bedtools
brew install snpeff

エラがーでる場合オフィシャルサイトからソースをダウンロードしビルドする。brewがない人はこちら

 

Rのライブラリは、データ分析に以下のものが必要。

library("ggplot2")

library(gplots)

library("reshape")

library("grid")

library("tools") #For compactPDF in R 2.13+

library(gsalib)

ない人はターミナルからRを呼び出し、

>R
install.packages("gsalib")

のようにしてインストール。終わったら

q()

でRを出る。

 

 

上記の他に、SnpEffのアノテーションデータと、データと合致するリファレンス配列を準備する必要がある(リファレンスの名前だけ違うとしても、アノテーション時にリファレンスと照合する時エラーになってしまう。)。 

 

詳細はクラミドモナスのリファレンスを用意する例を参考にしてください。

以上で準備は終了。