macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

マルチプルアラインメント結果からコンセンサス配列を出力するEMBOSSのconsコマンド

 

タイトルの通りのコマンド。

 

HP

EMBOSS: cons

 

インストール

macos10.12の miniconda3-4.3.21環境でテストした。

condaやbrewで導入できる。

#bioconda (link) 
conda install -c bioconda -y emboss

#homebrew
brew install emboss

seqret -h

$ seqret -h

Read and write (return) sequences

Version: EMBOSS:6.6.0.0

 

   Standard (Mandatory) qualifiers:

  [-sequence]          seqall     (Gapped) sequence(s) filename and optional

                                  format, or reference (input USA)

  [-outseq]            seqoutall  [<sequence>.<format>] Sequence set(s)

                                  filename and optional format (output USA)

 

   Additional (Optional) qualifiers: (none)

   Advanced (Unprompted) qualifiers:

   -feature            boolean    Use feature information

   -firstonly          boolean    [N] Read one sequence and stop

 

   General qualifiers:

   -help               boolean    Report command line options and exit. More

                                  information on associated and general

                                  qualifiers can be found with -help -verbose

 

 

実行方法

たえばmafft紹介)でマルチプルシーケンスアラインメントを行い、出力からコンセンサス配列を得る。consと打って実行。

cons

入力のFASTAと出力のFASTA名を順番に入力する。

$ cons

Create a consensus sequence from a multiple alignment

Input (aligned) sequence set: 

 

またはinputとoutputのfasta名を指定して実行。

cons inut.maf output.fasta

 

引用

EMBOSS: the European Molecular Biology Open Software Suite.
Rice P, Longden I, Bleasby A

Trends Genet. 2000 Jun;16(6):276-7.

 

関連