macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

GREAT

 

 ゲノム全体のDNA結合イベントを局所的に測定することで同定されたシス制御領域の機能的意義を解析するために、Genomic Regions Enrichment of Annotations Tool (GREAT)を開発した。従来の手法では、遺伝子の近位にある結合のみを考慮していたが、GREATは遠位にある結合部位を適切に取り込み、入力されたゲノム領域の二項検定を用いて偽陽性を制御することができる。GREATは、20のオントロジーからのアノテーションを組み込んでおり、ウェブアプリケーションとして提供されている。GREATを、SRF、NRSF、GABP、Stat3、p300などの転写関連因子のChIP-seqデータに適用したところ、既存の遺伝子ベースのツールでは見落とされていたこれらの因子の多くの機能が明らかになり、検証可能な仮説が得られた。GREATの有用性はChIP-seqに限らず、オープンクロマチン、局在化したエピゲノムマーカー、同様の機能的データセットや比較ゲノムセットにも適用可能である。

 

 

 

GREAT Documentation

https://great-help.atlassian.net/wiki/spaces/GREAT/overview

 

HPより

GREATは、既知または想定されるcis-acting non-codingゲノム領域のセットに対して、その近傍の遺伝子のアノテーションを解析することにより、生物学的な意味を推論します。多くの実験的・計算的スクリーニングにより、GREATの対象となるセットが得られます。GREATの一つの自然な応用例は、関心のある転写因子を用いたクロマチン免疫沈降(ChIP)実験のデータを解析することです。GREATを使って、結合部位付近の遺伝子でエンリッチされているアノテーションを見つける。

DAVIDやGO::TermFinderなどの他のアノテーションツールではなく、なぜGREATを使う必要があるのか?
他のアノテーションツールは遺伝子ベースです。テストセットは遺伝子のリストで構成され、ツールは遺伝子のバックグラウンドセットよりもテストセットでより一般的なアノテーションを提供します。遺伝子ベースのテストでは、遺伝子領域を遺伝子に割り当てる際のバイアスを考慮していないため、ゲノム領域のテストセットを正確にモデル化することはできない。GREATはより正確にモデル化し、一連のゲノム領域に対するエンリッチメントをより正確に算出することができる。

 

webサービス

GREAT Input: Genomic Regions Enrichment of Annotations Tool, Bejerano Lab, Stanford Universityにアクセスする。

f:id:kazumaxneo:20210516001110p:plain

 上のメニューからバージョン切り替えができる。

f:id:kazumaxneo:20210516004850p:plain

 

ヒトかマウスのゲノムアセンブリのバージョンを選ぶ。続いてテストリージョンファイルを指定する。BED形式(3つの必須フィールド(染色体、領域の開始位置、終了位置)をタブで区切って記述)で用意する必要がある。f:id:kazumaxneo:20210516001323p:plain
テストリージョンファイルには、入力領域ごとに1つのBEDレコードを含める。識別のために各BEDレコードに固有の名前を付けることが推奨されている。

 

バックグラウンド領域のファイルは、テスト領域のファイルと同様にBED形式で指定する。

f:id:kazumaxneo:20210516003953p:plain

バックグラウンドはメインの入力セットのスーパーセットでなければならない(つまり、入力セットのすべてのレコードがバックグラウンドセットにも含まれていなければならない)。ゲノムブラウザで正しい要素が表示されるように、レコードは正確に複製されていなければならない(つまり、名前、スコア、ストランドなどのオプションフィールドは、座標が同一であることに加えて、再現されていなければならない)。

(helpより)

 

 

demo出力結果

http://bejerano.stanford.edu/great/public/html/demo.php

f:id:kazumaxneo:20210516005019p:plain

f:id:kazumaxneo:20210516005044p:plain

f:id:kazumaxneo:20210516005058p:plain

f:id:kazumaxneo:20210516005133p:plain

出力についてはDocumentで詳細に説明されています。確認して下さい。

https://great-help.atlassian.net/wiki/spaces/GREAT/pages/655462/Output

引用

If you use GREAT in the context of human or mouse, please cite:
Cory Y McLean, Dave Bristor, Michael Hiller, Shoa L Clarke, Bruce T Schaar, Craig B Lowe, Aaron M Wenger, and Gill Bejerano. "GREAT improves functional interpretation of cis-regulatory regions". Nat. Biotechnol. 28(5):495-501, 2010. PMID 20436461

 

If you use GREAT in the context of zebrafish, please cite:
Michael Hiller, Saatvik Agarwal, Jim H. Notwell, Ravi Parikh, Harendra Guturu, Aaron M. Wenger, Gill Bejerano. "Computational methods to detect conserved non-genic elements in phylogenetically isolated genomes: application to zebrafish". Nucleic Acids Res., 2013. PMID 23814184

参考

Gene Set Analysis Software That Takes A Vcf As Input

https://www.biostars.org/p/94815/

 

関連