macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

リファレンスを変えて、変異株のゲノム配列を作る。

2019 8/3  リンク追加

2021 2/17 dockerhubリンク追加

 

変異のコール結果であるVCFファイルを元に変異株のゲノムを作りたいことが時々ある。そうゆう時は、gatkのFastaAlternateReferenceMakerが利用できる。

 

 マニュアル

f:id:kazumaxneo:20170913153420j:plain

 gatkがない人はbrewで導入しておく。

brew install gatk

2021 2/17 dockerhub (link)
docker pull broadinstitute/gatk3:3.8-1
docker run --rm -itv $PWD:/data/ broadinstitute/gatk3:3.8-1
java -jar GenomeAnalysisTK.jar -h

 

実行方法

 入力は変異コール結果のVCFファイルとそのリファレンスファイル。以下のように打つ。

gatk -T FastaAlternateReferenceMaker -R ref.fa -o output.fa -V indel.vcf
  • --lineWidth Maximum length of sequence to write per line (60). 

VCFファイルのコール部位通りに修正されたFASTAファイルが出力される。

  

  おまけ

この塩基置換が再現されているか、output.faからfastqをシミュレートで作り、WTのリファレンスにアライメントさせて確認する。

f:id:kazumaxneo:20170913152556j:plain

 

 変異が再現されている。

f:id:kazumaxneo:20170913152653j:plain

 

VCFtoolsでも同様のことができます。

cat ref.fa | vcf-consensus file.vcf.gz > out.fa 
  • --sample <name> If not given, all variants are applied
  • --haplotype <int> Apply only variants for the given haplotype (1,2)
  • --iupac-codes Apply variants in the form of IUPAC ambiguity codes

 

詳細はこちら