macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

GFF

配列のアノテーションに用いられる Sequence Ontology

Sequence Ontology(SO)は、配列のアノテーションに用いられる、配列の特徴を定義するための共同オントロジー・プロジェクト。SOのサイトでは、既存のオントロジーを確認することができる。簡単に見ていきます。 Request A Term https://github.com/The-Seq…

European Nucleotide Archiveへのゲノムアノテーションサブミットを容易にするコンバーター EMBLmyGFF3

過去20年にわたり、多くのシーケンスアノテーションツールが開発され、生命のツリーのすべてのkingdomの幅広い生物の比較的正確なアノテーションの作成を容易にしている。ゲノム内で注釈が付けられた機能を記述するために、Generic Feature Format(GFF)が…

染色体の遺伝子密度マップを描く DensityMap

2021 3/14 修正 ゲノムデータを可視化するためのツールはいくつか存在する。GbrowseやJbrowseのようないくつかのツールは、小さなゲノム領域に対しては非常に効率的であるが、ゲノム全体には適していない。また、PhenogramやCViTのように、ゲノム全体の可視…

GFF/GTFのfeatureをマージする feature_merge

タイトルの通りのツール。 インストール macos10.14でcondaを使って導入した。 依存 Github #bioconda (link)conda install -c bioconda -y feature_merge#pip (pypi)pip install feature-merge > feature_merge -h $ feature_merge -h Argument error( h ):…

タブ区切りゲノムポジションファイルにindexをつけて素早く問い合わせる tabix

コマンドラインやゲノムビューアで局所的なゲノム特徴を調べる場合、指定された領域に重なる特徴を検索するインターバルクエリを頻繁に実行する必要がある。インターバルクエリを数回しか行わない場合には、データファイル全体を読み込むこともできるし、イ…

GFF3を正確にソートする GFF3sort

HTML5とJavaScriptに基づく強力なゲノムブラウザとして、JBrowseは2009年にリリースされて以来広く使用されている[ref.1、2]。その構成ドキュメント[ref.3]によると、まず組み込みスクリプト「flatfile-to-json.pl」によってGFF3ファイル形式のゲノムアノテ…

GFF3のツールキット GFF3toolkit

i5k Workspace @ NAL (HP) でサポートされているGFF3toolkit(https://github.com/NAL-i5K/GFF3toolkit)は、節足動物ゲノムプロジェクトとその研究コミュニティからのGFF3形式の遺伝子アノテーションを処理するためのツールスイートを提供する。 遺伝子アノ…

GFF ファイルのユーティリティ Gffread

2019 10/15 誤字修正 2020 7/27 help更新 2020 8/14 コマンド追記 2020 12/25 誤字修正 多くのバイオインフォマティクスプログラムは、遺伝子および転写産物をGFF形式(General Feature Format)で表し、ゲノム上の遺伝子および転写産物の特徴(染色体または…

GTFとGFFフォーマット

2019 10/15追記 2020 10/13 リンク削除 GTF(General Transfer Format))はgeneのアノテーション専用のフォーマットと定義されている。それに対してGFF(General Feature Format)はtranscriptなどにも使えるよりジェネラルなフォーマットとなっている。この…