UCSCのゲノムブラウザーなどで使うフォーマット。最初の3列が必須で、オプションでさらに9列情報がつく場合がある。
最初の3列に記載する情報
- クロモソームの名前(e.g., chr1)
- リードや遺伝子のスタートポジション(ポジションは1でなく0スタート)
- リードや遺伝子のエンドポジション
追加の9列
- 名前
- 1-1000のスコア。スコアに応じて以下のようなカラー情報を持たせる事も可能である。
- リードや遺伝子の向き(+/-)
- CDSのスタートポジション。リードなら2の座標と同じになる。
- CDSのエンドポジション。
- exonの数
- 各exonのサイズ(数値をコンマで区切り全て記載する)
- exonのスタート位置。
BAMから変換したり、bed同士のオーバラップなどを分析するにはbedtoolsを使います。bedtoolsは以下で紹介しています。
引用
フォーマット一覧(UCSC)
https://genome.ucsc.edu/FAQ/FAQformat.html
アメリエフのブログ(旧)
http://blog.amelieff.jp/?eid=195350