macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

FASTA配列のオンラインツールボックス FaBox

 

FaBoxは、生物学者や医学研究者がシーケンスデータを使用して典型的なタスクを迅速に実行できるようにする、シンプルで直感的なWebサービスのコレクションである。 このサービスを使用すると、シーケンスヘッダーを簡単に抽出、編集、置換し、ヘッダー情報に基づいてデータセットを結合または分割できる。

 

注意: 大きなデータセットを使うようにはできていません。次世代のような大きなデータを投げないようにしてください。

 

使い方

http://users-birc.au.dk/palle/php/fabox/index.php にアクセスする。

f:id:kazumaxneo:20190806221641p:plain

 

1、FASTAのヘッダーを編集する。

f:id:kazumaxneo:20190807001714p:plain

下のウィンドウ内に抽出されるヘッダーを編集して、applyを押す。ヘッダーが編集後の状態になったFASTAが画面下に出力される。

 

 

2、FASTAのヘッダーをリプレースする。

f:id:kazumaxneo:20190807002026p:plain

1と似ているが、全く異なるヘッダーにする場合は、こちらを選ぶ。変化後のヘッダーを記載してapplyを押す。ヘッダーが置換されたFASTAが出力される。

 

 

3、ヘッダー内に指定した文字を含む配列を出力する。

f:id:kazumaxneo:20190807003033p:plain

下のウィンドウに文字を打ち込む。ヘッダーに合致する文字を含む配列が抽出される。

合致する文字を含む配列を除外する場合はFASTA sequence subtractorを使う。また、文字の有無で分割するならFasta dataset splitterを使う。

 

 

4、 2つのアラインメントを結合する。

f:id:kazumaxneo:20190807010631p:plain

左のウィンドウのアラインメントと右のアラインメントを水平方向に延長する形でつなぐ。

 

5、アラインメントの末端のギャップ領域をトリミングする。

f:id:kazumaxneo:20190807010932p:plain

 

6、アラインメントの可変領域のみ出力する。

f:id:kazumaxneo:20190807011111p:plain

 

他にもランダムなDNA配列を発生させるなどいくつかの機能がある。

引用

FaBox: an online toolbox for FASTA sequences

P. VILLESEN

May 2007 Molecular Ecology Notes 7(6):965 - 968

 

関連