2019 8/3 リンク追加
2021 2/17 dockerhubリンク追加
変異のコール結果であるVCFファイルを元に変異株のゲノムを作りたいことが時々ある。そうゆう時は、gatkのFastaAlternateReferenceMakerが利用できる。
マニュアル
gatkがない人はbrewで導入しておく。
brew install gatk
2021 2/17 dockerhub (link)
docker pull broadinstitute/gatk3:3.8-1
docker run --rm -itv $PWD:/data/ broadinstitute/gatk3:3.8-1
java -jar GenomeAnalysisTK.jar -h
実行方法
入力は変異コール結果のVCFファイルとそのリファレンスファイル。以下のように打つ。
gatk -T FastaAlternateReferenceMaker -R ref.fa -o output.fa -V indel.vcf
- --lineWidth Maximum length of sequence to write per line (60).
VCFファイルのコール部位通りに修正されたFASTAファイルが出力される。
おまけ
この塩基置換が再現されているか、output.faからfastqをシミュレートで作り、WTのリファレンスにアライメントさせて確認する。
変異が再現されている。
VCFtoolsでも同様のことができます。
cat ref.fa | vcf-consensus file.vcf.gz > out.fa
- --sample <name> If not given, all variants are applied
- --haplotype <int> Apply only variants for the given haplotype (1,2)
- --iupac-codes Apply variants in the form of IUPAC ambiguity codes
詳細はこちら