macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

複数の配列(multi-fastaファイルなど)を1つに配列に結合するEMBOSSのunionコマンド

 

EMBOSSのunionコマンドを使うと、複数の配列を読み込み、それらを連結して1つの配列として書き出すことができます。

 

EMBOSS union

https://emboss.sourceforge.net/apps/cvs/emboss/apps/union.html

 

multi fastaファイルを指定する。

union -filter mulit-seqence.fasta > single_sequence.fasta

 

-slower1をつけると小文字に、-supper1をつけると大文字になる。

#-slower1
union -filter -slower1 mulit-seqence.fasta > single_sequence.fasta

#-supper1
union -filter -supper1 mulit-seqence.fasta > single_sequence.fasta
  • -findoverlap オプションを使うと、隣接する結合領域間の重複をチェックし、重複しているかどうかの結果を報告する。

 

参考

Biostars

HOw to merge multifasta sequence into a single sequence having only one header?

 

関連