macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

エピゲノムプロファイルを用いた転写因子予測ツール BART

 

 ある遺伝子セットを制御する機能的な転写因子の同定は、遺伝子制御研究において重要な問題である。従来の転写因子の同定方法であるDNA配列モチーフ解析では、特定の因子の機能的な結合を予測することができず、遠位のエンハンサーに結合する因子を検出するには感度が不十分であった。BARTは、ヒトやマウスの400以上の因子に関する6000以上の既存のChIP-seqデータに基づいて、対象となる遺伝子セットを制御したり、対象となるゲノムプロファイルに関連したりする機能的な転写因子を予測する新しい計算手法およびソフトウェアパッケージである。この手法は、機能的ゲノミクス研究において、一般に公開されているデータを利用することの利点を示すものである。
 BARTはPythonで実装されており、http://faculty.virginia.edu/zanglab/bart で公開されている。

 

HP

https://zanglab.github.io/bart/index.htm

 


 

BART (Binding Analysis for Regulation of Transcription) は、ヒトやマウスの遺伝子発現を制御するシス制御領域に結合する機能的な転写調節因子 (TR) を予測するバイオインフォマティクスツールで、クエリ遺伝子セット、ChIP-seq データセット、スコアリングされたゲノム領域セットを入力として使用する。BARTは、Cistrome Data Browserで公開されている7,968個のヒトTR結合プロファイルと5,851個のマウスTR結合プロファイルを利用して予測を行う。

Github


webサービス

f:id:kazumaxneo:20210512234738p:plain

 

ヒトかマウスかを選択する。

f:id:kazumaxneo:20210512235319p:plain

 

データタイプを選択する。

f:id:kazumaxneo:20210512235127p:plain

 

デフォルトはGenelist。 ChIP-seqデータは、BAMまたはBEDフォーマットのマップされたファイルを指定する。BARTはChIP-seqのプロファイルと相関のある結合プロファイルを持つTRを同定することができる(入力には少なくとも100万リード推奨)。リージョン(ベータ)は、ChIP-seqのピークのように、スコアリングが付いたオーバーラップしないインターバルを持つBEDファイル。ゲノムのある領域でエンリッチされたTRを特定することができる。詳細はhelp参照。

f:id:kazumaxneo:20210512235410p:plain

 

Genelistを選択した場合、リストをアップロードする。

f:id:kazumaxneo:20210512235143p:plain

 

ここではexample data(160遺伝子)を貼り付けた。オフィシャル遺伝子シンボル(HGNC for human, MGI for mouse)を認識する。

f:id:kazumaxneo:20210512235239p:plain

入力には少なくとも100個の遺伝子を使うことが推奨されている。

 

任意でメールアドレスを記入してsubmitする。 

 

計算にはしばらく時間がかかる。example dataでは10分程度かかった。待ち時間中に表示されているCopy Keyボタンをクリックすると、ジョブキーを使って後からアクセスすることができる(ジョブ投入後180日間)。

 

出力

転写制御因子(TR)予測テーブル。

f:id:kazumaxneo:20210513000249p:plain

ウィルコクソン検定統計量とP値は、他のすべてのTRを背景に、各TRの関連性のレベルを示している、Zスコアは、バックグラウンドモデルと比較して、各TRの特異性を評価するためのもの。Max AUCは、そのTRの複数のChIP-seqデータセット間の最大の関連スコア。相対順位は、各TRのWilcoxon検定統計量、Z-score、maxAUCの平均順位を、TRの総数で割ったもの。Irwin-Hall のP値は、Irwin-Hall分布を無関係なランクのヌル分布として用いて、統合的なランクの有意性を示す(helpより)。

 

遺伝子名をクリックすると、そのTRの解析プロットが表示される。

f:id:kazumaxneo:20210513000358p:plain

 

詳細は論文とhelpを参照して下さい。

http://bartweb.org/help

引用

BARTweb: a web server for transcriptional regulator association analysis
Wenjing Ma, Zhenjia Wang, Yifan Zhang, Neal E Magee, Yayi Feng, Ruoyao Shi, Yang Chen, Chongzhi Zang
NAR Genomics and Bioinformatics, Volume 3, Issue 2, June 2021

 

BART: a transcription factor prediction tool with query gene sets or epigenomic profiles
Zhenjia Wang, Mete Civelek, Clint L Miller, Nathan C Sheffield, Michael J Guertin, Chongzhi Zang
Bioinformatics, Volume 34, Issue 16, 15 August 2018, Pages 2867–2869