macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

gtf

genome trackを可視化する svist4get

次世代シークエンシングは、生命科学の複数のハイスループットな方法を生み出した。その多くは、既存のゲノムアセンブリへのショートリードのマッピングに基づいている。マッピングされたリードの密度および計算により得られたゲノムシグナルトラックの可視…

複数のtranscritome情報(gtf)をマージする TACO

ハイスループットRNAシークエンシング(RNA-Seq)により、トランスクリプトームの詳細な理解が可能になった(ref.1–3)。手動および自動システムによる high fidelityな遺伝子モデルアノテーションの試みは、主にロースループットシークエンシング法(ref.4–…

BED、VCF、GTFをユーザー定義の方法でソートする gsort

gsortはゲノムファイルをソートするためのツール。たとえば、何らかの理由でVCFを並べ替えて、X、Y、2,1,3、などの順序で並べ替えることができる。他のソートツールでは不可能だったGATK order(1 ... X、Y、MT)に一致するようなソートもできる。ソートは、…

FASTQ、BED、BAMを操作するNGSUtilsその4 gtfutils

gtf

4回目はgtfを操作するgtfutilsを紹介する。 インストール 公式ページ NGSUtils git clone git://github.com/ngsutils/ngsutils.gitcd ngsutils/make #依存がインストールされる(詳細はwebマニュアル参照) $ gtfutils Usage: gtfutils COMMAND Commands Ge…

BEDOPSを使いVCF, GTF, GFF などを BED に変換 する。

BEDヘの変換はawkやperlやpythonのスクリプトで簡単にできるが、BEDOPSのvcf2nedを使うと、indelの種類などによってフィルタリングしながら分類することができ便利である。 BEDOPSがない人はbrewで入れておく。 brew install BEDOPS 公式マニュアル http://b…

GTFとGFFフォーマット

GTFはgeneのアノテーション専用のフォーマットと定義されている。それに対してGFF3はtranscriptなどにも使えるよりジェネラルなフォーマットとなっている。この違いのため、例えばUCSC genomeではgeneアノテーションファイルはgtfフォーマットでのみダウンロ…