macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

フォーマット変換 genebank => fasta

 

以前紹介したラッパーツールbwastを使うと楽にできる。

 

bwast.py sample1.gbk sample2.gbk

正規表現をサポートしているので、うまくワイルドカードを使えば大量のgenebakファイルから同時にfastaを抜き出すこともできる(正し*gbkと打っても受け付けない)。

 

 他にも方法はいろいろ考えられますが、コマンドが苦手ならsnap gene viewerなどで変換するのも手です。genebankファイルをsnap gene viewerで開き、別名で保存を選べばfastaを選択できます。

snap gene viewerは以前紹介しています。


 

NCBIからダウンロードしたgenebankファイルをGFFやbedに変換したいケースもあるかもしれませんが、その時はgenebankではなくGFF3などでダウンロードして、それからbedへ変換する手があります。UCSCでも行えますし、ツールもいくつかあります。

GFF=> BED 

convert2bed --input=gff < input.gff3 > output.bed

 GFF3でもいけます。