macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

リファレンス配列に点変異やSVを導入するEMBOSSのmsbar

2019 7/16 タイトル修正

 

EMBOSSパッケージのmsbarを使うと、リファレンスに変異を導入することができる。変異のシミュレーション実験などに使える機能である。

 

公式サイト

http://emboss.sourceforge.net

EMBOSS: msbar

 

インストール

embossはcondaやbrewで導入できる。

mamba install -c bioconda -y emboss

brew install emboss

 

実行方法

msbarをタイプし、指示に従えば変異を導入できる。

user$ msbar

Mutate a sequence

Input sequence(s): Homo_sapiens.GRCh38.dna.chromosome.19.fasta  

Number of times to perform the mutation operations [1]: 10

Point mutation operations

         0 : None

         1 : Any of the following

         2 : Insertions

         3 : Deletions

         4 : Changes

         5 : Duplications

         6 : Moves

Types of point mutations to perform [0]: 0

Block mutation operations

         0 : None

         1 : Any of the following

         2 : Insertions

         3 : Deletions

         4 : Changes

         5 : Duplications

         6 : Moves

Types of block mutations to perform [0]: 2

Codon mutation operations

         0 : None

         1 : Any of the following

         2 : Insertions

         3 : Deletions

         4 : Changes

         5 : Duplications

         6 : Moves

Types of codon mutations to perform [0]: 0

output sequence(s) [19.fasta]: out.fa

humanのchr19に構造変化を起こすInsertion変異を10回導入して、out.faで出力した。

 

ワンライナーでも動作する。

1-1000bpのBlock mutationを100回導入する。他の変異は発生させない。

msbar -sequence Homo_sapiens_chr19.fasta -outseq output.fa -count 100 -point 0 -block 3 -codon 0 -minimum 1 -maximum 1000

 

Point mutationの1塩基挿入を10回導入する。他の変異は発生させない。

msbar -sequence Homo_sapiens_chr19.fasta -outseq output.fa -count 10 -point 2 -block 0 -codon 0

 

変異後の配列からfastqを発生させてオリジナルの配列にマッピングすれば、変異株のリシーケンスのシミュレーション実験ができる。どうやら正確な変異のbreakpintをレポートする機能はないようなので、盲検テストとしてツール間の感度分析などに使うと良いかもしれない。

 

引用

EMBOSS: The European Molecular Biology Open Software Suite

Rice P, Longden I, Bleasby A.

Trends Genet. 2000 Jun;16(6):276-7.