2019 7/16 タイトル修正
EMBOSSパッケージのmsbarを使うと、リファレンスに変異を導入することができる。変異のシミュレーション実験などに使える機能である。
公式サイト
インストール
mamba install -c bioconda -y emboss
brew install emboss
実行方法
msbarをタイプし、指示に従えば変異を導入できる。
user$ msbar
Mutate a sequence
Input sequence(s): Homo_sapiens.GRCh38.dna.chromosome.19.fasta
Number of times to perform the mutation operations [1]: 10
Point mutation operations
0 : None
1 : Any of the following
2 : Insertions
3 : Deletions
4 : Changes
5 : Duplications
6 : Moves
Types of point mutations to perform [0]: 0
Block mutation operations
0 : None
1 : Any of the following
2 : Insertions
3 : Deletions
4 : Changes
5 : Duplications
6 : Moves
Types of block mutations to perform [0]: 2
Codon mutation operations
0 : None
1 : Any of the following
2 : Insertions
3 : Deletions
4 : Changes
5 : Duplications
6 : Moves
Types of codon mutations to perform [0]: 0
output sequence(s) [19.fasta]: out.fa
humanのchr19に構造変化を起こすInsertion変異を10回導入して、out.faで出力した。
ワンライナーでも動作する。
1-1000bpのBlock mutationを100回導入する。他の変異は発生させない。
msbar -sequence Homo_sapiens_chr19.fasta -outseq output.fa -count 100 -point 0 -block 3 -codon 0 -minimum 1 -maximum 1000
Point mutationの1塩基挿入を10回導入する。他の変異は発生させない。
msbar -sequence Homo_sapiens_chr19.fasta -outseq output.fa -count 10 -point 2 -block 0 -codon 0
変異後の配列からfastqを発生させてオリジナルの配列にマッピングすれば、変異株のリシーケンスのシミュレーション実験ができる。どうやら正確な変異のbreakpintをレポートする機能はないようなので、盲検テストとしてツール間の感度分析などに使うと良いかもしれない。
引用
EMBOSS: The European Molecular Biology Open Software Suite
Rice P, Longden I, Bleasby A.
Trends Genet. 2000 Jun;16(6):276-7.