macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2017-07-26から1日間の記事一覧

ゲノム情報はないが、モデル生物と近縁な生物のRNA seq 解析

ゲノム情報はないが近縁種のゲノムが解読されているような生物でRNA seqを行うと決まったら、どんなワークフローで進めるべきだろうか?マイクロアレイと違い、RNA seqならde novoでも解析は不可能ではない。ゲノムがモデル生物とほぼ同じならば、深く考えな…

フォーマット変換 FASTA => BED

fasta.faiから作る。 samtools faidx input.fasta awk '{print $1 "\t0\t" $2}' input.fasta.fai > output.bed またはpythonのスクリプトを使う。 pip install pyfaidx faidx --transform bed input.fasta > output.bed ヒトゲノムhg19ならこのようなbedがで…

BEDフォーマット

UCSCのゲノムブラウザーなどで使うフォーマットである。最初の3列が必須で、オプションでさらに9列情報がつく場合がある、BED形式は、最近ではインフォマティクスツールに使われる事もある。 最初の3列に記載する情報 クロモソームの名前(e.g., chr1) リ…